الأربعاء، 10 يونيو 2009

تدعم مفاهيم التنقيب في المعطيات...«Semania Encyclopedia»... تطبيق متقدم لطلبة الهندسة المعلوماتية بدمشق

تخرج الموسوعة الدلالية «Semania Encyclopedia» كأحد أهم وأبرز المشاريع والأفكار الإبداعية التي تضافرت لإنجازها جهود فريق عمل مجموعة قليلة من الشبان السوريين. وتتمثل الفكرة الرئيسية للموسوعة التي وضعها فريق من المهندسين من خريجي كلية الهندسة المعلوماتية بجامعة دمشق، بتطوير عملية البحث لتصل إلى إمكانية البحث الدلالي، وبهذه الطريقة يمكن للمستخدم أن يطرح سؤاله على الموسوعة ليحصل بذلك على نتيجة بحث مختلفة عن النتيجة التي يمكن له الحصول عليها من الموسوعات الإلكترونية التقليدية المعروفة للمستخدمين مثل «ويكيبيديا». وغني عن القول إن هذا النوع من الأعمال الإلكترونية إنما يحتاج إلى جهد بشري كبير جداً، حيث تعتبر الموسوعات الإلكترونية المعروفة قاصرة بعض الشيء لأنها تعتمد على صورة النص وتقدم «جوابا» مقابل «سؤال»، بينما الموسوعة «Semania» تتجاوز هذه المهمة إلى تقديم إجابات أكثر وضوحا ودقة، وموثوقية.
يشرح فريق العمل الخاص بهذه الموسوعة (عماد المهايني- محمد حجازي– طارق الجبان– حسان سيف– إياد طه) آلية عمل الموسوعة بقولهم إن عملية بحث في موسوعة مثل «ويكيبيديا» مثلا، وعند طرح السؤال أو البحث التالي: «مدينة تقع في آسيا»، فإن هذه الموسوعة ستقوم بالبحث عن جميع المستندات التي تحتوي على هذه الجملة كما هي حرفياً، أي إنها لن تقدم للمستخدم في هذه الحالة نتيجة بحث مثل «دمشق، بيروت، الرياض، عمان.. بينما الأمر يختلف في موسوعة «Semania» حيث يقدم البحث عن جواب للسؤال نفسه آنف الذكر نتائج قائمة على الذكاء الذي تم تضمينه بهذه الموسوعة. ويرى هؤلاء أن الإصرار على إنجاح المشروع، والإشراف الذي كرسه المهندس «عمار خير بك» على المستويات العلمية والتقنية والتنظيمية وغيرها من الموارد البحثية والمستقبلية للمشروع وغيرها، كانا كفيلين بإنضاج هذا المشروع الذي يعتبرونه إحدى الإضافات المهمة إلى مفهوم «البحث الدلالي».توزيع المهاميقول مصممو الموسوعة: إن الانطلاق بالعمل على هذه الموسوعة تطلب توزيع الأدوار على جميع أعضاء الفريق: ثلاثة منهم قسم الذكاء الصنعي، واثنان لقسم البرمجيات، وكلٌ منهم أخذ على عاتقه مهمة محددة كي تظهر في النهاية المحصلة النهائية لهذا المشروع المتمثل بالموسوعة Semania.يقول المهندس عماد المهايني من الفريق: تم أخذ الوثيقة ومعالجتها واستخلاص جميع المعارف التي تحتويها «Knowledge Extraction» ومن ثم تم تمثيلها بشكل معرفي للاستفادة منها لاحقاً ومن ثم تطبيق تقنيات الخدمات الخاصة بالموسوعة.وأشار المهايني إلى أن هذا العمل تطلب توافر تقنيات من قسم الذكاء الصنعي الذي تم فيه استخراج المعارف الموجودة في النصوص، ليقوم المهندسون من قسم البرمجيات بتوفير تقنيات الاسترجاع والتمثيل بالمعرفة.وأضاف «إن الوثائق التي تم التعامل معها تمت إعادة هيكلتها لتصير بشكل محدد يمكن تحليله ومنها مرحلة الفهرسة (هيكلة الوثائق) عبر أخذ الفقرات التي تحتويها لتحويلها إلى معارف يمكن تمثيلها».المهندس حسان سيف من قسم الذكاء الصنعي، يقول عن الشق المناط به: «احتاج المشروع إلى عملية مزج بين قسم الذكاء الصنعي وقسم البرمجيات، فبعد فرز الوثائق أخذنا المعارف الممثلة فيها وتم وضع مجموعة من الخوارزميات لاستخلاص المعارف الموجودة في هذه النصوص، لتصبح طريقة البحث بذلك قادرة على معرفة ماهية ومعنى مكونات جملة مثل «أكل الولد التفاحة»، فتصبح كلمة «الولد» واضحة بالنسبة للموسوعة الدلالية على أنها كائن بشري، وأيضاً معرفة أن «أكل» هو فعل الأكل للتفاحة وهكذا... ، وبالعودة إلى مثال السؤال «عاصمة في آسيا» فقد أصبحت الموسوعة «Semania» قادرة على معرفة أن مفردة «عاصمة» تعني مدينة ضمن دولة وهذه الدولة موجودة في قارة آسيا وهكذا...».وأشار سيف إلى استخدام تقنيات معالجة اللغة الطبيعية بهذا الخصوص.أما المهندس طارق الجبان من قسم هندسة البرمجيات فقال إن العمل على تقديم خدمات ذكية على مجموعة من الوثائق يتطلب إيجاد شيء مخصص لهذا الغرض لأن الأنظمة الحالية غير قادرة على فهم المعنى المضمن في هذه الوثائق. وكان الدور الأكبر للزملاء في تحويل بنية الوثيقة إلى بنية مهيكلة وبمعالجة اللغات الطبيعية يتم الوصول إلى ما يسمى «الشجرة الصرفية»، وأضاف: «للوصول إلى مرحلة تطبيق الخدمات على هذه الوثائق كان يجب علينا تمثيل المعلومات ببنية قادرة على فهمها وهذا هو البرنامج بعينه». وعن دوره في المشروع قال الجبان إنه بعد تحليل النصوص والوثائق وإنتاج أشجار صرفية قمنا بتحويل البيانات التي وصلت إلينا وفق تمثيل معين تفهمه الآلة حتى نكون قادرين على تقديم أي خدمة.. هذا كان في المرحلة الأولى، وفي مرحلة لاحقة تم العمل على محرك استدلالي. وأكد الجبان أن تقسيم المشروع إلى أجزاء عديدة سيساعدنا فيما بعد على القيام بالتعديلات المطلوبة على المشروع في حال تطلب الأمر، وأصبحنا قادرين على استخدام هذه الأجزاء في مشاريع أخرى كمعالجة اللغات الطبيعية وإيجاد النماذج الصرفية...ويقول المهندس إياد طه من قسم هندسة البرمجيات إن أي مشروع من دون فكرة لا يمتلك روحاً وإنه حتى الآن لا وجود لمنتج تجاري من هذا النوع خرج من مخابر البحث، في إشارة إلى حال القوة الهائلة التي سيكون عليها عملاق البحث على الإنترنت غوغل في حال أصبح يتسم بخاصية البحث الدلالي. وأضاف طه: إن مرحلة التحليل الصرفي يتبعها مرحلة ربط هذه المفاهيم مع بعضها بعضاً عبر تحليل صرفي لكل وثيقة موجودة في هذه الموسوعة ثم ربط المفاهيم الناتجة عبر الـ«Ontology»، وبين طه أن دورهم كمبرمجين لهذا المشروع فرض عليهم تطبيق جميع مراحل هذه الهندسة على المشروع وإدارته وتوصيفه للوصول إلى النتيجة المرجوة.خدمات الموسوعة Semaniaوعن الخدمات التي تقدمها هذه الموسوعة أكد المهندس محمد حجازي أن الموسوعة ستكون في المستقبل قادرة على تقديم خدمة البحث عن جملة معينة أو عن نص معين بشكل دقيق ودلالي يتبعها خدمة البحث العادي المعروفة للجميع، وخدمة التصنيف الآلي حيث يمكن للمستخدم منح النظام مجموعة من الوثائق ليكون بذلك قادراً على تحديد طبيعة هذه الوثائق ومواضيعها المختلفة سواء في الطب، الرياضيات، العلوم والأدب وغيرها إذ يقوم بتجميعها بنفسه، وهناك أيضاً خدمة الربط الآلي بين الوثائق. وفي حديثهم يؤكد فريق العمل أن هناك توفيراً كبيراً في الجهد البشري خلال البحث وصحة الربط الكبيرة التي تخلو تماماً من أخطاء البحث. وتحدثوا أيضاً عن خدمة التجميع الدلالي، وخدمة الترجمة الدلالية التي يؤكدون عدم وجودها في أي نظام آخر، وهي تساعد على تحديد المعنى الحقيقي والصحيح للكلمة في سياق الجملة مع إمكانية الترجمة الآلية لـ«الوثائق» مع «ذكاء» وينتج عن ذلك ترجمة آلية للوثائق المتخصصة بموضوع معين. ويضاف إلى ذلك أن نظام هذه الموسوعة متكامل ويمكن في نفس الوقت استخدام أجزائه في أماكن وتطبيقات أخرى.المطلوب دعم وتعاون المهتمينوحول إمكانية خلق نوع من التعاون مع جهات أخرى تهتم بهذا المجال يؤكد فريق عمل المشروع أن المجال ممكن مع «الموسوعة العربية» التي تشمل مختلف المواضيع إلا أن الخدمات الموجودة على موقعها مازالت بسيطة جداً على الرغم من الأهمية الكبيرة لها ونعتقد أنها لم تستطع حتى الآن اجتذاب العدد المطلوب من الزوار.وأكد القائمون على Semania مشاركتهم في المؤتمر الوطني الأول لدعم المحتوى الرقمي العربي على الإنترنت وهو ما قد يمكنهم من عرض هذا المشروع أمام أهم المسؤولين والمهتمين بدعم المحتوى الرقمي العربي على الإنترنت وخصوصاً أن الخدمات التي تقدمها Semania تم تطبيقها بشكل جزئي لأنه من المستحيل لفريق مكون من خمسة أفراد الوصول بمفردهم إلى نهاية وإتمام المشروع بشكل كامل. ومن هذه النقطة يشير فريق العمل إلى ضرورة تمويل ومتابعة ودعم واهتمام من قبل بعض الجهات المعنية، ولا يخفي الفريق إدراكهم لمدى حجم اتخاذ مثل هذا القرار الإستراتيجي وطريقه الطويل جداً. وأكد الفريق أنه في حال تواجدت النية في إضافة كل الخدمات الجديدة على الموسوعة العربية فالقدرات موجودة والفريق جاهز لتلقي المساعدة للمساعدة أيضاً.ووجه الفريق دعوة مفتوحة للجميع للمضي قدماً في هذه الطريق التي خطونا الخطوات الأولى فيها وعلى رأسها مركز البحوث العلمية والجامعة لأنهم قادرون على وضع آلية تراكم هذه الخبرات وخصوصاً فيما يتعلق بالويب الدلالي. وتمت الإشارة إلى هذه الخبرات المتخصصة في مجال الموسوعات الدلالية وتقنيات البحث والاسترجاع في قسم البرمجيات بكلية الهندسة المعلوماتية وكذلك معالجة النص واستخراج المعارف وربطها باللغات الطبيعية في قسم الذكاء الصنعي في الكلية. وأكد الفريق أن الكلية شهدت الكثير من المشاريع التي تمت الاستفادة منها ووجهت فريق العمل إلى قطع الكثير من الخطوات والجهد، وأثنى الفريق على جهود من سبقوهم في مشاريع تؤسس لمشروع الموسوعة الدلالية إذ قطفوا ثمار جهود شهور طويلة من عمل من سبقوهم من زملائهم لتتحول بين أيديهم إلى مواد علمية وخبرات جاهزة للتصرف بها.
http://www.alwatan.sy/dindex.php?idn=58759

ليست هناك تعليقات:

إرسال تعليق