You are currently viewing اكتشاف النعاس لدى السائق استنادًا إلى الميزات المكانية الزمانية باستخدام الشبكات العصبية التلافيفية ثلاثية الأبعاد

اكتشاف النعاس لدى السائق استنادًا إلى الميزات المكانية الزمانية باستخدام الشبكات العصبية التلافيفية ثلاثية الأبعاد

اقيمت حلقة نقاشية من قبل ا.م.د نور ضياء جواد  التدريسية في قسم الحاسوب / كلية علوم الحاسوب وتكنولوجيا المعلومات عن (DRIVER DROWSINESS DETECTION BASED ON SPATIO-TEMPORAL FEATURES WITH 3D CONVOLUTIONAL NEURAL NETWORKS) والذي يتحدث عن كيفية استخدام وتنفيذ ومراقبة سلوك الشخص في نظام رؤية الكمبيوتر في تطبيقات التحكم المختلفة التي توفر التفاعل بين الإنسان والآلة. يقوم جوهر أنظمة الرؤية الحاسوبية هذه على استخراج السمات المختلفة للإنسان ثم تتبع خرائط الميزات هذه عبر السلاسل الزمنية. تعتمد العديد من طرق استخراج ميزة الفيديو على صورة واحدة وتستخرج هذه الطرق الميزة المكانية بناءً على إطار واحد في كل مرة. لكن هذه الأساليب تعاني من نقص في الكفاءة بسبب عدم استخدام هذه الأنظمة لجميع المعلومات التي يوفرها الفيديو ، والاختلاف في ظروف الإضاءة بمرور الوقت ، وكذلك في معظم سيناريوهات الحياة الواقعية يتغير التعبير البشري بشكل عفوي بشكل غير متجانس عاطفة لا يمكن التعرف عليها في إطار واحد. استخلصت الأساليب القائمة على الصور المتعددة الميزات واتخاذ القرار بناءً على السلاسل الزمنية من خلال تحليل تسلسل الصور (إطارات الفيديو) التي استخدمت المعلومات المتاحة في تسلسل الصور. في هذه الورقة ، تم تقديم نظام التصنيف المكاني الزماني لتحديد نعاس السائق بناءً على الشبكات العصبية العميقة ثلاثية الأبعاد (3D-CNN). تأخذ الميزات الزمنية والمكانية في الاعتبار واستخراج الميزات المدمجة وتتبعها على مدار السلاسل الزمنية أثناء النظام المقترح ويمكن أن تحقق دقة أفضل مقارنة بـ 2D CNN. تم تدريب واختبار النظام المقترح باستخدام مجموعة بيانات الفيديو “NTHU Drowsy Driver Detection (NTHU- DDD)” والتي قدمت خمسة سيناريوهات مختلفة لكل موضوع. يمكن للنظام المقترح أن يحقق الدقة مع مجموعة التدريب تصل إلى 96٪ ومجموعة التحقق تصل إلى 93٪. تصل قيم دالة الخسارة إلى 0.1206 لمجموعة التدريب و 0.2318 لمجموعة التحقق من الصحة.