الفهرس | يوجد فقط 14 صفحة متاحة للعرض العام |
المستخلص يُعد التلخيص الآلي للنصوص العربية أحد المجالات الدراسية في اللغة العربية والتي مازالت قيد الدراسة، والتلخيص الآلي عبارة عن نص مختصر تم إنتاجه من واحد أو أكثر من النصوص (المستندات) بحيث يحتوي على أهم المعلومات من النص الأصلي، وفي مجال التلخيص الآلي يوجد نوعين للتلخيص هما: الملخصات الاستخراجية (Extraction)، الملخصات التجريدية (Abstraction)؛ إلا أن مجال التلخيص الآلي عادةً ما تسيطر عليه تقنيات التلخيص عن طريق الاستخراج، حيث يتم انتاج ملخص آلي يحتوي على أهم النصوص الموجودة بالنص الأصلي. أهمية الدراسة: في هذه الدراسة تم اقتراح نموذج للتلخيص الآلي للنصوص العربية قائم على تقنيات التلخيص عن طريق الاستخراج، يتكون النظام المقترح من ثلاث مراحل رئيسية هي: تجهيز النص (The pre-processing phase)، المعالجة (The processing phase)، الملخص النهائي (The final summary phase). هدفت هذه الدراسة إلى: اقتراح نموذج للتلخيص الآلي للنصوص العربية قائم على تقنيات التلخيص عن طريق الاستخراج، يتكون النظام المقترح من ثلاث مراحل رئيسية هي: تجهيز النص (The pre-processing phase)، المعالجة (The processing phase)، الملخص النهائي (The final summary phase). تكونت عينة الدراسة من: مجموعة من المقالات تم تجميعها من موسوعة ويكيبيديا حيث تم اختيار عينة عشوائية مكونة من 33 مقالة مكتوبة باللغة العربية في عدة مجالات مختلفة مثل: علم الفلك، علم الأحياء، علم الكيمياء... الخ؛ كما تنوعت حجم المقالات بين مقالات طويلة تحتوي على ثلاث فقرات أو أكثر أو متوسطة تحتوي على فقرتين أو صغيرة تحتوي على فقرة واحدة. نتائج الدراسة: جاءت درجة تقييم الخبراء البشريين للنظام المقترح (التلخيص الآلي) بشكل عام مناسبة، إذ بلغ المتوسط الحسابي لاستجابات المحكمين على الاستبيان في المحاور الأربعة (الشكل العام والمضمون، تماسك العبارات، عدم الإسهاب أو التكرار، اكتمال المعنى) ككل 80%. تم مقارنة النظام المقترح مع عدة نظم أخري لتلخيص النصوص؛ وأظهرت النتائج تفوق النظام المقترح في مقياس ROUGE، وتبين من استخدام النظام المقترح أن تقنيات التلخيص عن طريق الاستخراج يمكن من خلالها الحصول على أهم الجمل وبالتالي الحصول على ملخصات جيدة خاصة في المستندات صغيرة الحجم. |