تعلم الآلةمترجم

هل الانحياز في نماذج تعلم الآلة سيء دائماً؟

كاتب المقال: Asel Mendis   ترجمة: هيا الداوود   مراجعة: فارس القنيعير

[ رابط المقال الأصلي هنا ]

خلال السنين الماضية تعلمنا أن وجود الانحياز (bias) في النماذج التنبؤية سوف يضر النموذج. مهمة التحكم بالانحياز تتطلب أن تكون بيد الشخص الذي يستطيع التفريق بين الانحياز الجيد والسيء.

 

نشر توم م. ميتشل ورقة بحثية عام 1980 عنوانها: The Need for Biases in Learning Generalizations ذكر فيها النص التالي:

جزء من عملية التعلم يتضمن القدرة على التعميم من التجارب السابقة، بحيث تكون لدينا القدرة على التعامل مع المواقف الجديدة والتي تكون “مرتبطة” بهذه التجربة. هذه القفزة الاستدلالية تحتاج إلى التعامل مع المواقف الجديدة والتي تبدو ممكنة تحت تحيزات معينة فقط لاختيار تعميم واحد فقط للموقف دون الآخر. هذه الورقة البحثية تعرِّف بدقة مفهوم الانحياز في مشاكل التعميم، بعدها سوف توضح ضرورة وجود التحيزات لحدوث قفزة في عملية الاستدلال.

خلال السنين الماضية تعلمنا أن وجود الانحياز في النماذج التنبؤية سوف يضر النموذج. مهمة التحكم بالانحياز يجب أن تكون بيد الشخص الذي يستطيع التفريق بين الانحياز الجيد والسيء. ورقة ميتشل تنص على أن هناك أنواع معينة من الانحياز تستطيع مساعدتنا على صنع النموذج المناسب للمشكلة التي بين يدينا، هذه الأنواع موضحة في النقاط التالية:

1.معرفة الحقائق بالمجال

في تعلم التعميم لغرض معين، قد يكون الحد من التعميم ممكناً من خلال توفيقه بين المعرفة العامة واختصاص المهمة. في برنامج لتعلم مهارات لعبة البيسبول (سولواي ورايزمان 1978)، المعرفة العامة عن ألعاب المنافسات تقيد عدد التعميمات المعتبرة. هذا النوع من المعرفة السطحية يستطيع أن يعطي قيد قوي ومبرر على التعميمات المعتبرة. في هذه الحالة هدف نظام التعميم يصبح “تحديد التعميمات المتناسقة مع متطلبات التدريب ومع الحقائق الأخرى المعروفة عن مجال المهمة”.

2.الاستخدام المقصود للتعميمات المُتَعلمة

معرفة الاستخدام المقصود للتعميمات المتعلمة قد يعطي انحياز قوي للتعلم. مثال بسيط: اذا كان القصد من استخدام التعميمات المتعلمة يتضمن أن تكلفة الأخطاء الموجبة تكون أعلى بكثير من تصنيفات الأخطاء السالبة، إذن برنامج التعلم سيفضل التعميمات المتخصصة على نظيرتها من التعميمات العامة مع نفس بيانات التدريب.

3.المعرفة بمصدر بيانات التدريب

المعرفة بمصدر بيانات التدريب تستطيع تقييد التعلم بشكل مفيد. على سبيل المثال، عندما نتعلم من معلم/معلمة، نحن نستفيد من وجود الافتراضات الكثيرة بوجود منهج منظم لتقييد بحثنا عن التعميمات المناسبة. في حال وجود منهج معد، نميل إلى التركيز بحذر على ميزات حالات محددة بشكل يزيل الغموض عن أي من التعميمات المحتملة الأكثر ملائمة.

4.الانحياز للتبسيط والعمومية

إحدى التحيزات التي نستخدمها نحن البشرهي التحيز للتفسيرات البسيطة والعامة. القدرة على التفسير تسمح لنا بتوصيل نماذجنا لجمهور عادي والنماذج المغلقة (Black box) قد تعيق عمل صانع النموذج.

5.المقارنة مع تعميمات متعلمة سابقاً

في حال كان لدينا نظام يتعلم مجموعة من المفاهيم المتشابهه أو التعميمات، إذن فأي قيد محتمل على تعميم أي واحد منهم بالتالي يعتبر تعميماً ناجحا للبقية. على سبيل المثال، لنعتبر مهمة تعلم الوصف المنظم لعالم من الأجسام (blocks-world objects)  مثل الأبراج والأقواس وما إلى ذلك. بعد تعلم عدة مفاهيم، الوصف المتعلم قد يكشف أن بعض الخصائص لها أهمية لوصف فئة من المفاهيم أكثر من غيرها. على سبيل المثال إذا كانت لغة التعميم تحتوي على خصائص مثل الشكل، اللون والعمر لكل قالب (Block) في المنظومة، النظام قد يلاحظ أن العمر نادراً ما يكون خاصية مهمة لتشكيل الفئات (classes) المهيكلة وقد يتكون انحياز لصالح الخصائص الأخرى. التبرير لهذا الانحياز المتعلم يجب أن يكون مبني على بعض المتشابهات المفترضة في الاستخدام مما سيتيح تعلم هذه المفاهيم.

رغم أن هذه الورقة من عام 1980 إلا أن المنطق الذي بنيت عليه يحثنا على التفكير في كيفية التفرقة بين التحيزات الضرورية وغير الضرورية في النماذج. مما لاشك فيه أن علينا أن نقلل التحيزات التي قد تشكل عائقاً، لكن كلما تدربنا أكثر وبحثنا بعمق سنجد أن بعض التحيزات ستساعد النموذج ليصبح على الشكل الذي نريده أن يصبح عليه.

اظهر المزيد

Haya Aldawood

هيا مهتمه بتعلم الآلة وعلم البيانات وتطبيقاتهما. متخرجة من جامعة الملك سعود بدرجة بكالوريوس العلوم في إدارة الأعمال.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى