Search In this Thesis
   Search In this Thesis  
العنوان
An proposed system based on artificial intelligence to summarize data from electronic texts /
المؤلف
Doweidar, Mona Galal Ahmed.
هيئة الاعداد
مشرف / نى جلال احمد دويدار
مشرف / حي الدين إسماعيل العلامي
مشرف / أحمد السيد امين
مناقش / حي الدين إسماعيل العلامي
الموضوع
Computer Teacher - Preparation.
تاريخ النشر
2018.
عدد الصفحات
133 P. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
العلوم الاجتماعية
تاريخ الإجازة
1/1/2018
مكان الإجازة
جامعة المنصورة - كلية التربية النوعية - عداد معلم الحاسب الالى
الفهرس
Only 14 pages are availabe for public view

from 158

from 158

Abstract

الملايين من الوثائق الالكترونية متوفرة عبر الانترنت فى جميع مجالات الحياة ،لذا نحن في حاجة ماسة إلى عملية تلخيص آلى للنصوص لالكترونيه للاستفادة منها بالشكل الامثل . يرغب كل مستخدم في التركيز على جمل معينة قد تهمه دون غيرها، لذا فإن الاهتمام بإنتاج ملخص آلى ذات مواصفات قياسيه هو أمر ملح في الوقت الحالي. عملية استخراج الملخص الالى الامثل هو عملية إنشاء نسخة مصغر من النص الأصلي تلبي متطلبات المستخدم. ”أسلوب الاستخراج” يعتبر أحد طرق استخراج أهم الجمل في المستند ، ويستخدم هذا الأسلوب في اختيار الجمل بعد حساب درجة لكل جملة ، وبناءً على نسبة الاختصار المحدده من قبل المستخدم ، يتم اختيار اعلى عدد جمل كملخص. يمثل اختيار الجملة المعلوماتيه تحديًا لباحثي تلخيص النص التلقائي القائم على الاستخراج. وقد طبقت الدراسة طريقة استخراج النص الملخص التلقائى من المستند الفردي باستخدام خوارزمية امثلية سرب العناصر(PSO) للعثور على أفضل درجة وزن لسمة للتفريق بين سمة هامة وغير هامة. يسمح النظام المقترح للمستخدم بإعداد ملخص للوثائق على أساس أربع طرق ، ثلاثة منها تعتبر الأكثر استخدامًا في الملخصات بينما الرابعة هي طريقة مقترحة تعتمد على تقنيات الذكاء الاصطناعي لتحسين السمات المستخلصة من ملخصات الطرق الثلاثة السابقة وأهم السمات بالنسبة للمستخدم.تم استخدام مجموعة أدوات الاستدعاء الموجه (( Recall-Oriented Understanding للتقييم من ادوات (F-measure) لقياس الأداء. استخدمت مجموعة بيانات DUC 2007 التي قدمها (Document Understanding Conference 2007) في عملية التقييم. تمت مقارنة الملخص الذي تم إنشاؤه بواسطة خوارزمية امثلية سرب العناصر(PSO) مع الخوارزميات الأخرى بالتحليل الدلالى الكامن (LSA) ، Gong & lui ، وModeling Vector Space ، واستخدام خوارزمية Swarm Optimization كمعايير. أظهرت النتائج التجريبية أن الملخصات التي أنتجتها خوارزمية امثلية سرب العناصر تعطى نتائج اجابيه عاليه بالمقارنه مع الخوارزميات الأخرى. 1.تحليل وفهرسة الوثائق الالكترونية. 2. تحديد محتوى (الفريد / ذات صلة) بالوثيقة ، لتحديد المحتوى الملائم للتلخيص من المحتوى الذي يمكن تجاهله. 3.تصفية محتوى الوثيقة ليتناسب مع متطلبات المستخدم. 4. استخراج الملخص الالى. كيف يمكن إنشاء نظام ملخص تلقائي للحصول على معلومة قيمة من الفقرات النصية للنصوص الإلكترونية؟ الفصل الأول) : مقدمة(تناولت فيه الباحثة عرض لمشكلة الدراسة وتساؤلاتها، وكذلك عرض لاهداف الدراسة واهميتها. الفصل الثانى : (الدراسات السابقة) تناولت فيه الباحثة عرض لبعض الدراسات السابقة المرتبطة بالدراسة. شمل الدراسات المتعلقة بالتلخيص الالى للنص ، ثم الدراسات المتعلقة بخوارزمية التحليل الدلالى الكامن وgong&lui ، ثم دراسات المتعلقة بخوارزمية vector space modeling ثم الدراسات المصاحبة لخوارزمية امثلية سرب العناصر خوارزمية للحصول على ملخص النص الالى. الفصل الثالث : (خلفية معرفية)وتناولت الباحثة مقدمة عن مفهوم التلخيص النصي وجوانب التلخيص و طرق التلخيص نصوص اليا والتصنيف (تلخيص مفرد ومتعدد المستندات) ، وأنواع الملخصات ، ومخطط عمل عام لأنظمة التلخيص ، وخوارزمية امثلية سرب العناصر ، وطرق تقييم الملخصات الالية. الفصل الرابع : (بناء نظام تلخيص الى زكى )تناولت الباحثة عرض مشاكل خواريزمات تلخيص النص الالى وصياغة السؤال الامثلية لمعرفة سمات الملخص الامثل مع وجود السمات المفترضة على هذه المكونات، تصميم خريطة تدفق لحل المشكلات وإنتاج مُلخص النص الأمثل (OTS) ، بعد تطبيق الخواريزمات الثلاث (LSA,Gong&Lui and VSM) ، بعد انتاج ملخص الى بثلاث طرق مشهورة للتلخيص يظهر ثلاث ملخصات مختلفة النتائج تاخذ هذه النتائج ويطبق عليها خواريزم PSO)) لانتاج الملخص الامثل. مع توصيف وعرض للواجهات الرسوميه لنظام التلخيص الالى الذكى . الفصل الخامس ) :نتائج التجريبية و التقييم (وقد تناولت الحلول البحثية لقضية الامثلية من خلال تطبيق خوارزمية امثلية سرب العناصر(PSO) ، والحصول على أفضل الجمل التي تمثل النص الأصلي وتلبية طلب بحث المستخدم ، ويتم تقديم الملخص الناتج بطريقة منطقية متناسقة مع تسلسل النص الأصلي ، ومن ثم اختبارات الملخص عن طريق تقييم ( F-measure Evaluation).