Search In this Thesis
   Search In this Thesis  
العنوان
Advanced statistical analysis modeling for Arabic speech recognition /
المؤلف
Sultan, Wael Ali.
هيئة الاعداد
باحث / وائل على بسيوني سلطان
مشرف / حسن نصر أحمد اسماعيل
مناقش / محمد هشام فاروق السيد
مناقش / محمد حسين عيد
الموضوع
Mathematics study and teaching. Physics study and teaching. Engineering study and teaching.
تاريخ النشر
2016.
عدد الصفحات
97 P. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
الهندسة (متفرقات)
تاريخ الإجازة
1/1/2016
مكان الإجازة
جامعة بنها - كلية الهندسة بشبرا - الرياضيات و الفيزيقا الهندسية
الفهرس
Only 14 pages are availabe for public view

from 113

from 113

Abstract

تعتبر اللغة العربية من أوسع اللغات انتشاراً في العالم، و يمثل نظام التعرف على الأصوات العربية محاكاة للمستمعين حيث يقوم بتحويل الكلمات العربية المنطوقة إلى مكتوبة. و تعتبر الخطوة الأولى تجاه تحقيق هذه المهمة هي التعرف على المقاطع الصوتية الجزئية (الفونيمات) و التي تتشكل منها الكلمات. و على الرغم من قيام أبحاث كثيرة بالتحقيق في عملية بناء أنظمة التعرف على الفونيمات العربية إلا أن هذا المجال هو من المجالات التي تحتاج إلى مزيد من اهتمام الباحثين مستقبلا. لقد سيطر المنهج الإحصائي المدعوم بالبيانات على أنظمة التعرف على الأصوات عموما على مدار العقود الماضية. هذا المنهج نفسه سيطر عليه أداه إحصائية قوية تدعى نموذج ماركوف الخفي. يحقق هذا البحث أولا في هذه النماذج الإحصائية خاصةً نموذج خليط جاوس و نموذج ماركوف الخفي، وثائيا يقدم البحث طرق استخدام هذه النماذج في بناء محرك فعال للتعرف على الفونيمات العربية. خلال هذ العمل و لتحقيق الأهداف سابقة الذكر، تم بناء و تهيئة نماذج ماركوف الخفيه لكل فونيم في اللغة و تم تدريبهم على قاعدة بيانات ELRA باستخدام خوارزمية (EM) من خلال خوارزمية (Baum-Welch)، ثم بعد ذلك تم اختبارهم باستخدام خوارزمية (Viterbi). و تم دراسة العوامل الخاصة بأنظمة ماركوف الخفية كالعدد الكلي للحالات في النظام و القفزات فيما بينها، كما تم دراسة تأثير زيادة عدد خليط جاويس بالنسبة للنظام. و في النهاية تم عرض النتائج الخاصة بكل حالة و تم تقديم الاقتراحات بالشكل الذي يساهم في رفع كفاءة النظام. تتكون هذه الرسالة من خمسة أبواب: الباب الأول: يقدم هذا الباب دراسة مسحية للفروق الأساسية للطرق المستخدمة في بناء نظام التعرف على الأصوات بصفة عامة و الأصوات العربية بصف خاصة، كما يستعرض هذا الباب أيضا أهم الأبحاث التي تمت على نظام التعرف على الأصوات العربية خلال العقد الأخير، كما يوضح الباب أهم الأسباب الدافعة لبدء هذا العمل و كذا الأهداف المرجوة منه.الباب الثاني: يعرض هذ الباب مراجعة للنماذج الإحصائية المستخدمة في عملية التعرف على الأصوات العربية. أولاً يحقق الباب في خليط جاوس و كيف يمكن التوقع بالمتوسط الحسابي لكل خليط عن طريق خوازمية (EM) و ما هو الدور الذ يقوم به خليط جاوس في نظام التعرف على الأصوات. و ثانيا يقدم الباب لسلاسل ماركوف و نماذج ماركوف الخفية من حيث التعريف و المشاكل الأساسية التي يمكن استخدام نماذج ماركوف الخفيه في تمثيلها، ويستعرض الباب أهم أنواع تلك النماذج و كيف يمكن اختيار النموذج الأمثل لتطبيق معين. الباب الثالث: يقدم هذا الباب نظرة عامة على أساسيات أنظمة التعرف على الأصوات - و على وجه التحديد- من حيث كيفية استخراج الخصاص المناسبة من الموجات الصوتية، تلك الخصاص التي تساعد على التمييز بين مقطع صوتي جزئي (فونيم) و آخر حيث تم استخدام تقنية (MFCC) كطريقة لاستخراج هذه الخصائص. أيضا يناقش الباب مبادئ النمذجة الصوتية و النمذجة اللغوية الخاص بأنظمة التعرف على الأصوات. الباب الرابع: يعرض هذا الباب أداة (HTK) و كيف يمكن استخدامها في بناء أنظمة التعرف على الأصوات العربية و كذلك قواعد البيانات المتاحة و التي استخدمت خلال هذا العمل في تدريب و اختبار نماذج ماركوف المقترحة كما يعرض بقيه الإعدادات اللازمة خلال عملية التدريب و الإختبار. وخلال هذا الباب تم عرض كيف يمكن عمل النمذجة الصوتية للفونيمات و التي سيتم اعتمادها في التجارب المقدمة في الباب الخامس. الباب الخامس: يقدم هذا الباب التجارب التي تم اعتمادها على نماذج ماركوف بهدف تحسين الأداء العام للنظام، وتهدف هذه التجارب تحديداً في تحدد القيمة المثلى لمجموعة معاملات خاصة بنماذج ماركوف و بقية مكونات النظام بحيث يمكن الوصول بالنظام إلى الكفاءة المثلى في التعرف على الأصوات العربية. و على هذا تم اقتراح سبعة نماذج ماركوف مختلفة وتم دراسة النتائج المحصلة من كل نموذج و من ثم تمت مقارنتهم و تم تبني النموذج الأفضل على صعيد النتائج، و كتطبيق أخير تم تجربة هذا النموذج على محرك (KWS-Engine) قام ببنائه مجموعة بحثية بكلية الهندسة (جامعة القاهرة). و أخيرا يقدم الباب خلاصة لما تم دراستة و كذلك التوصيات لما سيتم دراسته مستقبلاً.