مقدمة
تعلم المفاهيم (Concept Learning)، كذلك يعرف بتعلم الأصناف أو تكوين المفاهيم، ينمي الإدراك والوعي لدينا بحيث يساعدنا على تصنيف وتمييز العناصر (كالأشكال، الألوان الأصوات، الصور، الملمس، أو الطعم) المختلفة اعتماداً على خصائصها. علماء النفس الإدراكي يشيرون إلى أن تعلم المفاهيم هي أساس الإدراك لدى المخلوقات، أي قرار يتم اتخاذه يتم بناءً على تحليل الوضع والذي بدوره يتطلب إدراك المفاهيم. تعلم المفاهيم يتطلب وضع استراتيجية تساعد على الوصول للمفاهيم بشكل سريع ودقيق عن طريق مقارنة تشابه واختلاف خصائص وسمات العناصر المختلفة ووضعها في مجاميع متفرقة تعكس تصانيفهم المختلفة مثل تصنيف وسائل النقل إلى فئات مختلفة حسب تشابه وإختلاف أشكال مقطوراتها، عجلاتها، أنماط حركتها، الأوساط التي تتحرك عليها، مدى توفر أجنحة بها، الخ …
يتعلم الطفل السليم المفاهيم تدريجياً من خلال تخزين سمات العناصر التي تواجهه في الشبكات العصبية (Neural Networks) شيئاً فشيئاً حتى يكتسب خبرة تمكنه من تمييز الأشياء المختلفة بشكل دقيق إلى حد ما وإتخاذ القرارات السليمة المناسبة وفقا للموقف الذي يصادفه. قد يستطيع الطفل في عمر السنتين التمييز ما بين الألوان المختلفة، وفي عمر الثلاث سنوات يمكنه التمييز بين أصوات الحيوانات المختلفة لكن قد لا يستطيع التمييز ما بين الحيوانات الخطرة والأليفة إلا عندما يكبر. وفي سن المراهقة قد يستطيع التمييز بين ألوف الأشخاص بدقة وبسرعة هائلة ويستطيع الانتباه لأوجه التقارب والاختلاف بين الناس بعضهم بعضا بفضل نعمة العقل والإدراك التي وهبها لنا الله تعالى.
تعلم المفاهيم والذكاء الاصطناعي
ومن هذا المنطلق حرص علماء الذكاء الاصطناعي (Artifical Intelligence)، وتحديداً تعلم الآلة (Machine Learning)، على تطوير تقنيات تساعد على صنع نماذج تقوم بتعلم المفاهيم تلقائياً من خلال عرض مجموعة من المشاهدات (التجارب أو الأمثلة) عليها لتساعدها على تعلم المفاهيم وصهرها في نماذج (Models) قابلة للتطبيق على مشاهدات جديدة مستقبلاً.
يتم تعلم نماذج المفاهيم من خلال المشاهدات التي تعبر عن أمثلة للعناصر المتعلقة بالمفهوم يرافقها مجموعة من الخصائص المحددة ذات قيم وأنواع بيانات مختلفة متبوعة بنوع التصنيف (تعلم تصنيفات محدد Supervised Learning of Concept) الذي يعكس مفهوم المشاهدة. تقوم خوارزمية تعلم الآلة بقراءة جميع المشاهدات وحصر الخصائص التي تميز التصنيفات المختلفة عن طريق معادلات مقارنة درجة التشابه والاختلاف بين خصائص العناصر التي تميز التصنيفات المختلفة. ومن ثم تقوم الخوارزمية ببناء قاعدة منطقية (نموذج التعلم) بحيث اذا ما تم عرض مشاهدة جديدة، مشابهه لتلك المشاهدات التي تدرب عليها مسبقاً، تستطيع تمييز صنفها بنجاح.
من الجدير بالذكر أنه ليست كل المفاهيم بسيطة وواضحة بحيث تسمح بتعلمها بتلك السرعة والدقة المطلوبتين، حيث أن هناك كم هائل من المفاهيم التي تتطلب استراتيجيات وسمات أكثر تعقيداً لتعلمها سواءً كان المتعلم إنسان أو آلة. ناهيك عن تلك التي قد لايكون ممكناً تعلمها، أو لا يمكن تعلمها بالدقة اللازمة. في بعض الحالات يتم نمذجة المفهوم المعقد من خلال تعلم عدة نماذج أصغر تعكس أوجه مختلفة للمفهوم المعقد والتي، في نهاية المطاف، تستخدم تكاملياً لتعلم ذاك المفهوم المعقد.
قد يكون هناك مطلب لتعلم تصنيف جديد غير معروف مسبقاً (اختراع مفهوم)، ومن ثم فلا يوجد تصنيف محدد يراد الوصول إليه (تعلم تصنيف غير محدد Unsuperviced Learning of Concept) وتقييم مدى دقته، بالتالي تكون هناك دالة تقوم بتقييم مدى جودة القاعدة التي تحاول خوارزمية تعلم الآلة نمذجتها، وعليه يتم اختيار القاعدة أو حزمة من القواعد التي تعطي أفضل نتائج عند تطبيق هذه الدالة.
بشكل عام نستطيع تعريف تعلم المفاهيم على أنه
مهمة تقود إلى تصنيف مجموعة من العناصر إلى فئات متجانسة بحيث تحوي كل فئة على مجموعة من العناصر التي تتشابه خصائص عناصرها فيما بينها والعكس صحيح.
ما يميز خوارزميات تعلم المفاهيم عن غيرها من خوارزميات تعلم الآلة أنه في الغالب يتم استخدام هذه الخوارزميات لتعلم مفهوم محدد، يسمى مفهوم الغاية (Positive Concept)، يتسم بالقدرة على بناء دالة ثنائية منطقية (Logical Boolean Function)، بحيث تكون الدالة على شكل مجموعة من القواعد ممثلة بمجموعة شروط اذ–ثم (IF-THEN Conditions) والتي تعكس القاعدة التي يجب أن تتحق حتى يتم تصنيف المفهوم بشكل صحيح. كمثال بسيط على ذلك في مجال المواصلات:
إذا توفر للعنصر (كبينة و أجنحة و مروحة أفقية) أو (كبينة وأجنحة ومحرك نفاث) أو (كبينة ومروحة عمودية): يصنف العنصر على أنه طائرة.
لاحظ أن هذه القاعدة تستطيع تمييز جميع أنواع الطائرات عن طرق المواصلات الأخرى بشكل دقيق إلى حد كبير.
في الغالب يستخدم نوعين لنمذجة دالة القواعد الثنائية المنطقية: إما نموذج معتمد على الشكل الشجري (Tree-based)، أو نموذج معتمد على حزمة من القواعد (Rule-based) وكلاهما يفي بالغرض، لكن هناك فروقات بسيطة بينهما. في النموذج الشجري يتم التحقق من تلبية خصائص العنصر للقاعدة بشكل هرمي من الأعلى (جذر الشجرة) إلى الأسفل (أوراق الشجرة) بحيث يكون هناك مسار واحد يؤدي إلى النتيجة بغض النظر عن ما إذا كان الحل ناجحاً أم لا. يتم ترتيب الشروط بعناية بحيث يتم وضع الشروط الأكثر تمييزاً للعناصر بالأعلى بينما يتم وضع الشروط الأقل تمييزاً أقرب للأوراق بالأسفل وذلك بناءً على أحد معادلات التقييم مثل (Entropy, Information Gain, or Chi-Squared)
المثال التالي يوضح النموذج الشجري لمثال تعلم مفهوم الطائرة:
المثال التالي يوضح نموذج مبني على حزمة من القواعد لمثال تعلم مفهوم الطائرة. يتم التحقق من هذة القواعد بشكل تسلسلي بحيث يتم التوصل للنتيجة الإيجابية إذا ما تحققت جميع شروط أي من القواعد المدرجة في النموذج. وفي حال ما لم يتحقق أي منها فهناك نتيجة افتراضية في نهاية النموذج تدل على أن العنصر المراد التحقق منه لا يحقق المفهوم، ليس طائرة في هذا المثال:
تعلم عدة مفاهيم في آن واحد
تجدر الإشارة أن العديد من الخوارزميات الشجرية تسمح بتعلم أكثر من مفهوم، يمثل عدد من الاصناف، في نموذج واحد من خلال تعقيد النموذج الشجري بمزيد من الشروط في وسط الشجرة التي تسمح للتفريق بين سمات الاصناف المختلفة وتمييزها قبل الوصول للنتيجة في الاوراق. ولكن النماذج ذات القواعد التسلسلية تتطلب تعلم عدد من النماذج ثنائية التمييز (Binary Models) بشكل منفصل قبل أن يتم دمجها بأحد طرق دمج نماذج التعلم الثنائية لاحقا والتي لايوجد مجال لذكرها هنا وقد نتطرق إليها في أحد المقالات لاحقا.
المميزات والعيوب
تمتاز نماذج تعلم المفاهيم بوضوحها وسهولة قراءتها من قبل الإنسان لاعتمادها على النماذج الترميزية (Symbolic Models). لذى يمكن بسهولة استخدامها لنظم دعم اتخاذ القرار، فتستخدم كثيراً في التحقق من الآليات والإجراءات الإدارية والمالية وكذلك نظم التحقق من مدى صلاحية الأجهزة وإجراءات التحقق من جودة المنتجات وما إلى ذلك. كما يمكن التحكم بمدى تعقيد النموذج بتغيير بعض إعدادات البرنامج المتعلم مثل تحديد الحد الأقصى للمستويات في النماذج الشجرية أو الحد الأقصى لعدد القواعد أو الشروط في النماذج المعتمدة على القواعد (rules).
خوارزمات تعلم المفاهيم تتميز عن غيرها من فروع تعلم الالة هو قدرتها على التعلم من أنواع البيانات غير الرقمية مثل (Nominal or Binary Date Type) بشكل مباشر.
تعتمدخوارزمات تعلم المفاهيم على طرق البحث الإرشادية (Heuristic Search) بحيث تساعد خوارزم التعلم بالبحث في فضاء الفرضيات بناءا على الأمثلة والمشاهدات المتاحة للتدرب والتعلم منها بطرق منطقية. في حال كان هناك تعارض كبير في الأمثلة المتاحة أو كانت مساحة البحث كبيرة جدا لايمكن تغطيتها، قد لايتمكن خوارزم تعلم الآلة من الوصول للحل المناسب في الوقت المناسب.
بعض المراجع
هناك عدة مراجع يمكن الاستفادة منها للتعمق أكثر في هذا الموضوع, من أشهرها:
- (Machine Learning) لتوم ميتشيل
- (Machine Learning: The Art and Science of Algorithms that Make Sense of Data) لبيتر فلاخ
ختاما أتمنى أن يحوز المقال على إعجابكم وأن يكون قد أعطى مقدمة مفيدة عن تعلم المفاهيم. كما أرحب بأي استفسارات أو مقترحات لمقالات قادمة.
سلمت دكتورنا.
عندما قرأت مصطلح concept learning ذهبت لوهله إلى Concept Class و Instance Space و Versions Space.
المصطلح متداول بأكثر من مجال فرعي لتعلم الآله مثلاً في rough set theory تجده , في query learning تجده. ولاادري اذا كانوا أصلاً نفس الشئ أم لا.
* خاطره أحببت أن أقولها.
أهلا د. عيسى،
شكرا على المداخلة اللطيفة وهنا أود التوضيح أن Concept Learning هو مصطلح عام يشمل العديد من الخوارزمات التي تعتمد على البحث في فضاء الحلول (فضاء الفرضيات Hypothesis Space) المقبولة باستخدام طرق البحث الإرشادية (Heuristic Search).
بالنسبة لفضاء المشاهدات (Instance Space)، فهو يعكس جميع المشاهدات أو الأمثلة المتوفرة للتعلم عليها ونمذجتها مع جميع المعلومات المتعلقة فيها من خصائص وحقائق. وهذا الفضاء يساعد خوارزم التعلم على بناء فضاء الفرضيات (Hypothesis Space) المقبولة ومن ثم يتم تصفيتها في مايسمى بفضاء الفرضيات الممكنة (Version Space) من خلال المنطق الاستدلالي (Inference Logic)، بحسب الإعدادات المختارة للتعلم، وذلك قبل بدء عملية البحث عن الفرضية أو مجموعة الفرضيات التي ستشكل نموذج التعلم النهائي من المشاهدات المتاحة.
Heuristic Search Methods هي عبارة عن معادلات حاسوبية تُقيٌم مسار البحث والفرضيات التي يتم العثور عليها.
استاذ عيسى العنزي . هل كانت لديك معلومات و مقدمة يمكن مشاركتها في موضوع rough set theory ؟