رسالة ماجستير في كلية الإدارة والاقتصاد بجامعة القادسية تناقش خوارزميات التشخيص الكلي لشواذ متعدد المتغيرات بأستخدام مصفوفات تقدير الموقع والقياس الحصينة مع التطبيق


نُوقشت بقسم الإحصاء في كلية الادارة والاقتصاد /جامعة القادسية رسالة الماجستير الموسومة ب (خوارزميات التشخيص الكلي لشواذ متعدد المتغيرات بأستخدام مصفوفات تقدير الموقع والقياس الحصينة مع التطبيق)
تهدف الرسالة إلى اقتراح خوارزمية جديدة لتحسين أداء طريقة التشخيص الكلي DRGP(MVE) من خلال إستخدام مصفوفة الموقع والقياس (RMVN) تكون مستقرة أطلقنا عليها مسمى DRGP (RMVN).
اقتراح خوارزمية جديدة لتحسين أداء طريقة التشخيص الكلي IDRGP(MVE) من خلال إستخدام مصفوفة الموقع والقياس (RMVN) تكون مستقرة أطلقنا عليها مسمى IDRGP (RMVN).
اقتراح خوارزمية جديدة لتحسين أداء طريقة التشخيص الكلي IDRGP(MVE) باستخدام بواقي (LMS) من خلال أستخدام مصفوفة موقع وقياس بمسمى(IMLMS)وكذلك أستخدام مصفوفة الموقع والقياس (RMVN) مع بواقي طريقة (MM) تكون مستقرة أطلقنا عليها مسمى(IRMM)ودراسة المحاكاة بالمقارنة مع الطريقة السابقة.
إختبار سرعة الاحتساب الزمني لطرقنا المقترحة مع الطرق السابقة باستخدام المحاكاة .
اختبار كفاءة الطرق المقترحة باستخدام المحاكاة لأحجام عينة مختلفة ونسب تلويث مختلفة ومن ثم اختيار أفضل ألطرق المقترحة التي أثبتت كفاءتهما في دراسة المحاكاة والتطبيق مع البيانات الحقيقية والمقارنة مع نظيراتها من الطرق السابقة ( تشخيص فردي وكلي ) .

وتضمنت الرسالة ما يأتي: نظراً لأهمية موضوع تشخيص الشواذ أقترح الباحثون طرقاً لتشخيص تلك الشواذ التي تظهرفي النماذج الإحصائية المختلفة المختلفة إلا ان هذه الطرق اعتمدت على إسلوب التشخيص الفردي للشواذ. لذلك اقترح عدد من الباحثين مؤخرا عدداً من طرق التشخيص الكلي Grouped Diagnostics لان طرق التشخيص الفردي أظهرت عدم قدرتها على كشف ظاهرتي الـ (Masking& Swamping): ظاهرة الـــMasking.
لذا لاحظنا أمرين مهمين من خلال الطرق السابقة أنها لم يأخذا بنظر الاعتبار إن ظاهرتي (Masking& Swamping) ممكنة الحدوث عند وجود قيم شاذة مؤثرة في حد الخطأ العشوائي و على وجه الخصوص نموذج الانحدار الخطي و بما إن Hadi وضع طريقته لمعالجة الشواذ لبيانات متعدد المتغيرات فإن طريقة DRGP(MVE) و طريقة (IDRGP(MVE تعاملتا مع مصفوفة المتغيرات التوضيحية (X)على أنها مصفوفة متعدد متغيرات لا يمكن القول عنها إنها مصفوفة متعدد متغيرات طبيعية لان فرضية التوزيع الطبيعي المشترك لهذه المتغيرات تم خرقها بسبب وجود الشواذ و إن عملية تثبيتها في نموذج انحدار خطي متعدد يفقدها صفة العشوائية و يجعلها خاضعة للقياس. اما ألأمر الثاني فقد لاحظنا أن الأساس في بناء خوارزميات DRGP(MVE)و (IDRGP(MVE هي حساب مسافة مهنالوبيز بالاعتماد على مصفوفة الموقع والقياس MVE.
بناء على ما تقدم إقترحنا في هذه الرسالة التعامل مع مصفوفة المتغيرات التوضيحية لنموذج الانحدار الخطي المتعدد على أنها مصفوفة متعدد متغيرات تم خرق فرضية توزيعها المشترك بالشواذ. من جانب آخر وظفنا مصفوفة الموقع والقياس(RMVN) التي تعتمد على خوارزمية الخطوات الخمسة متعددة المراحل في ثلاث خوارزميات جديدة وهي (DRGP(RMVN), IDRGP(RMVN), IDRGP(MM)) بهدف الحصول على إختزال جيد للتشخيص الخاطئ للطريقتين السابقتين , فضلاً عن مراعاة زمن الاحتساب وإستقرار كل طريقة.
لقد تم إخضاع الطرق كافة لعدد من دراسات المحاكاة ونوعين من البيانات الحقيقية ( هندسية ومالية ( , وأظهرت النتائج أن طريقة DRGP(RMVN) المقترحة هي طريقة كفوءة وفعالة مع أحجام البيانات الكبيرة , أما طريقة IDRGP(RMVN) فهي طريقة كفوءة وفعالة مع أحجام البيانات الصغيرة. كما تبين أن الطريقتين المقترحتين سريعتان إلى حد ما لكنهما ليستا أسرع من طريقة IDRGP(LMS) وفقاً لنتائج المحاكاة. بالاضافة إلى ذلك لاحظنا أن طريقة IDRGP(MM) نجحت من خلال دراسة المحاكاة بالوصول إلى الشواذ كافة إلا إنها عانت النوع الأول للخطأ كثيرا عند إضافة عدد غير مقبول من التشخيص الخاطئ إلى تشخيصها الصحيح. بالإضافة إلى ذلك لاحظنا ان طريقة IDRGP(LMS) طريقة سريعة جدا و فعالة الى حد ما خصوصا عن ارتفاع حجم العينة إلا إنها لم تكن مستقرة، علما إن كلتا الطريقتين لم تتعامل مع البيانات على انهما بيانات متعدد متغيرات لأنها ضمت المتغير المعتمد (Y) لنموذج الانحدار الخطي في مصفوفة بياناتها.
وتوصلت الرسالة إلى نتائج مفادها أنه مما تقدم يتضح أن طريقة DRGP(RMVN) هي طريقة كفوءة وفعاله مع أحجام البيانات العالية ول…

التعليقات معطلة.