نوقشت في كلية علوم الحاسوب وتكنولوجيا المعلومات بجامعة القادسية رسالة الماجستير الموسومة بالقيادة الذاتية للمركبة باستخدام خوارزمية التعليم المعزز العميق لتجنب التصادم
(An Autonomous Vehicle With Deep Reinforcement Learning for Collision Avoidance) للطالب حيدر صلاح عبد الامير تحت اشراف الاستاذ الدكتور علي عبيد شراد .
تضمنت الرسالة كيفية تدريب سياسة القيادة الحضرية الكاملة لمحاكاة القيادة CARLA من خلال الجمع بين التعلم المعزز العميق (على وجه الخصوص ، تحسين السياسة القريبة (PPO)) مع تعلم المناهج.
قدمت الرسالة نتائجها مع وكيل قائم على المناهج في مجموعة واسعة من المقاييس والمدن والطقس وحالات المرور. بالإضافة إلى ذلك ، فقد سلطت الضوء على سببين رئيسين لعدم الاستقرار تعلم وظيفة القيمة V (s) وتوحيد وظيفة الميزة المتوقعة A هما خطوتان أساسيتان في خوارزميات RL (s ، a).
كما جرى تقديم مناهج جديدة لمعالجة هذه المخاوف. يمكن تحسين أي خوارزمية RL قائمة على القيمة ، بما في ذلك خوارزميات الممثل والناقد .
هدفت الدراسة الى كيفية تصميم مركبة ذاتية القيادة دون تدخلات البشرية باستخدام خوارزمية التعليم المعزز العميق لسلامة الناس من الحوادث وتقليل الوفيات المرورية وتغيير الروتين اليومي .
وقد قُبلت الرسالة بتقدير إمتياز.