نُوقشت في قسم الإحصاء رسالة الماجستير الموسومة ب ( اختيار متغيرات نموذج بواسون مع التطبيق ) للطالب محمد حسين نعمة.
تهدف الرسالة إلى اختيار المتغيرات المهمة في نموذج بواسون باستخدام عدد من الطرق وهي (Deviance , Liklihood Ratio , AIC , P-value ) تقدير معلمات المتغيرات المختارة بأستخدام نماذج بواسون وشبه بواسون و ذو الحدين السالب واختيار افضل نموذج من النماذج المذكورة في (2) باستخدام معايير المعلومات (AIC , BIC , AICn , BICHQ) , اذا ان افضل نموذج هو من تتفق عليه كل المعايير بأن تكون اقل القيم واستخدام المحاكاة لمعرفة تأثير معلمة الشكل في توزيع ذي الحدين السالب على اختيار النموذج المناسب لواقع البيانات بوجود مشكلة فرط التشتت والمشاهدات المؤثرة والمتغيرات الزائدة.
تضمنت الرسالة عرضا بينت فيه أن نماذج بواسون اكتسبت اهمية كبيرة في العديد من المجالات العلمية التطبيقية ولاسيما في المجالات الطبية. اذ ان نموذج بواسون يستخدم عند حدوث الحالات النادرة , لكن من الصعوبة بمكان ان نجد بيانات حقيقية تتوافق مع نموذج بواسون. لذلك تم اقتراح العديد من النماذج للتعامل مع بعض الحالات التي وجدت في عالم البيانات الحقيقية, مثلا عند وجود حالات فرط التشتت وبالاعتماد على حجم ذلك التشتت يمكن استخدام نماذج العد من هذه النماذج , نموذج شبه بواسون للحالات خفيفة التشتت و نموذج ذي الحدين عندما يكون التشتت شديدا. وهناك نماذج تستخدم مع حالات نقص التشتت. في هذه الدراسة تناولنا نموذج انحدار بواسون مع وجود مشكلة فرط التشتت, اذ اننا ركزنا على اختيار افضل المتغيرات عند تطبيق أي نموذج من نماذج العد السابقة , لذلك اعتمدنا على اختيار افضل المتغيرات بأستخدام (Deviance , Liklihood Ratio , AIC , P-value ) , ومن ثم لجأنا الى المقارنة بين نموذج بواسون قبل حذف بعض المتغيرات (النموذج الكامل) ونموذج بواسون بعد حذف المتغيرات , بالإضافة الى المقارنة مع نموذجي شبه بواسون وذي الحدين السالب , اذ اخذنا بنظر الاعتبار حجم تأثير معلمة الشكل على احصاءة التشتت بوجود مشكلة اساسية في بيانات العدد , الا وهي ظهور عدد من المشاهدات المؤثرة (Influential Observation) او النقاط الرافعة (Leverage Point) في هذا النوع من البيانات بعد اخذ اللوغاريتم للدالة الاسية.
توصلت الرسالة إلى أن هناك تأثيراً واضحاً لقيمة معلمة الشكل في توزيع ذي الحدين على اختيار النموذج المناسب لواقع البيانات والتي بينت من خلال المحاكاة ان معلمة الشكل اذا كانت تساوي الواحد الصحيح فإنها تؤدي الى تضخم احصاءة فرط التشتت , مما يجعل توزيع ذي الحدين السالب هو النموذج المناسب للبيانات , اما اذا كانت معلمة الشكل اكبر من الواحد الصحيح فأن احصاءة التشتت سوف تنخفض بشكل كبير مما يجعل نموذج شبه بواسون هو الافضل على الرغم من وجود المشاهدات المؤثرة الا ان اختيار افضلية نموذج على اخر تُبنى فقط على حجم احصاءة فرط التشتت , اذ ان وجود فرط التشتت قد أثر بشكل واضح على نموذج بواسون سواء قبل اختيار المتغيرات المهمة او بعد اختيار المتغيرات المهمة.