التعلم الآلي (ML) هو مجال فرعي من الذكاء الاصطناعي (AI) يركز على تطوير الخوارزميات والنماذج التي تمكن أجهزة الكمبيوتر من التعلم من البيانات واتخاذ التنبؤات أو القرارات بناءً عليها.
وهويهتم بتطوير الأنظمة الحسابية التي يمكنها تحسين أدائها وسلوكها تلقائيًا من خلال الخبرة، دون أن تتم برمجتها بشكل صريح.
الفكرة الأساسية وراء التعلم الآلي هي تمكين أجهزة الكمبيوتر من تعلم الأنماط والعلاقات والرؤى من البيانات، ثم استخدام تلك المعرفة لأداء مهام محددة أو عمل تنبؤات بشأن بيانات جديدة غير مرئية. ويتم تحقيق ذلك من خلال تطوير وتدريب النماذج، وهي عبارة عن تمثيلات رياضية أو خوارزميات يمكنها التعميم من البيانات الموجودة لإجراء تنبؤات أو اتخاذ إجراءات بشأن البيانات الجديدة.
ونظرًا للاهتمام الذي حظي به التعلم الآلي والمشكلات المعقدة التي يحلها، فقد يبدو الأمر كالسحر. ولكن الأمر ليس كذلك. إنها مبنية على أساس الرياضيات والإحصاء، والتي تم تطويرها على مدى عقود عديدة.
إحدى الطرق العملية جدًا للتفكير في التعلم الآلي هي أنه طريقة فريدة لبرمجة أجهزة الكمبيوتر. معظم البرمجة التي لا تعتبر تعلمًا آليًا (والبرامج العملية التي تعامل معها البشر كثيرًا على مدار الخمسين عامًا الماضية) هي برامج إجرائية، فهي في الأساس مجموعة من القواعد التي يحددها الإنسان. تسمى مجموعة القواعد هذه بالخوارزمية.
في التعلم الآلي، يتم اختيار الخوارزمية الأساسية أو تصميمها بواسطة الإنسان. ومع ذلك، فإن الخوارزميات تتعلم من البيانات، بدلاً من التدخل البشري المباشر، حول المعلومات التي ستشكل نموذجًا رياضيًا للتنبؤات. لا يعرف البشر هذه المعلومات أو يحددونها، فالآلة هي التي تفعل ذلك. وبعبارة أخرى، يتم استخدام مجموعة البيانات لتدريب نموذج رياضي بحيث يعرف ما يجب فعله بها عندما يرى بيانات مماثلة في المستقبل. عادةً ما تأخذ النماذج البيانات كمدخل ثم تقوم بإخراج تنبؤ بشيء مثير للاهتمام.
لا يحتاج المديرون التنفيذيون إلى أن يكونوا خبراء في التعلم الآلي، ولكن حتى بالقليل من المعرفة يمكن أن يقطعوا شوطًا طويلاً. إذا تمكنا من فهم الأنواع الأساسية من الأشياء التي يمكننا القيام بها باستخدام تعلم الآلة، فستكون لدينا فكرة عن مكان البدء ومعرفة ما يجب علينا البحث فيه. ولن يتعين علينا أن نطلب من الفريق الفني بشكل أعمى أن “يقوم ببعض السحر” ثم نأمل أن ينجحوا.
في هذه المقالة، سنبدأ بتقنيات التعلم الآلي، وسنتناول التحدي الأساسي لتعلم الآلة، ثم نتعمق في التعلم العميق، وأخيرا نناقش الحقائق المادية والحسابية التي تجعل كل ذلك ممكنًا.
تم تصميم خوارزميات التعلم الآلي لتحديد واستخراج الأنماط والميزات ذات المعنى تلقائيًا من البيانات المدخلة، مما يسمح للنماذج بالتنبؤ أو اتخاذ القرارات. يمكن تصنيف هذه الخوارزميات على نطاق واسع إلى أنواع رئيسية وهي:
- التعليم الخاضع للإشراف.
- التعليم غير الخاضع للإشراف.
- التعليم شبه الخاضع للإشراف.
تقنيات التعلم الآلي
التعلم الخاضع للإشراف
غالبًا ما تتعلم الآلات من نماذج البيانات التي تحتوي على مثال للمدخلات ومخرجات نموذجية.
على سبيل المثال: قد يكون زوج عينة البيانات عبارة عن بيانات مدخلة حول التاريخ الائتماني للفرد، والمخرجات المرتبطة هي مخاطر الائتمان المقابلة (إما يحددها الإنسان أو بناءً على النتائج التاريخية). وبإعطاء ما يكفي من عينات المدخلات والمخرجات، تتعلم الآلة كيفية بناء نموذج يتوافق مع العينات التي تدربت عليها.
ومن هنا، يمكن تطبيق النموذج على بيانات جديدة لم يسبق له رؤيتها من قبل – في هذه الحالة، التاريخ الائتماني للأفراد الجدد. وبعد التعلم من بيانات العينة، يطبق النموذج ما تعلمه على العالم الحقيقي. حيث يتم إعطاء النتيجة المتوقعة المرغوبة، ويتم “الإشراف” على النموذج لمعرفة معلومات النموذج المرتبطة.
يعرف البشر الإجابة الصحيحة، ويشرفون على النموذج أثناء تعلمه كيفية العثور عليه. نظرًا لأنه يجب على البشر تصنيف جميع البيانات، فإن التعلم الخاضع للإشراف يعد عملية تستغرق وقتًا طويلاً.
تشمل مشكلات التعلم الخاضعة للإشراف ما يلي:
- Classification التصنيف:
- الهدف من مشكلة التصنيف هو تحديد المجموعة التي ينتمي إليها مدخل معين. على سبيل المثال , حالة طبية حيث تكون الاحتمالات وجود مرض / عدم وجود مرض. مثال كلاسيكي آخر هو تصنيف صور الحيوانات إلى مجموعة قطط ومجموعة كلاب.
- يتم تدريب الآلة على البيانات مع العديد من أمثلة المدخلات (مثل صورة حيوان) بالإضافة إلى المخرجات المقابلة، والتي تسمى غالبًا تسميات (مثل “قطة” أو “كلب”). قم بتدريب النموذج بمليون صورة للكلاب والقطط، ويجب أن يكون قادرًا على تصنيف صورة لكلب جديد لم يكن موجودًا في بيانات التدريب.
- Regression التراجع او الانحدار:
- مثل التصنيف، يتعلق التراجع أيضًا بالمدخلات والمخرجات المقابلة. لكن مخرجات التصنيف عادة ما تكون أنواعًا منفصلة (قطة، كلب)، ومخرجات التراجع هي رقم عام. بمعنى آخر، إنه ليس 0 أو 1، ولكنه مقياس متدرج للاحتمال. على سبيل المثال، في ضوء الصورة الإشعاعية، يمكن للنموذج أن يتنبأ بعدد السنوات الإضافية التي سيقضيها الفرد المرتبط بالمرض أو بصحة جيدة.
التعلم غير الخاضع للإشراف
يتم استخدام خوارزميات التعلم غير الخاضعة للإشراف عندما تكون البيانات غير مصنفة أو تفتقر إلى متغيرات مستهدفة واضحة. الهدف هو اكتشاف الأنماط أو الهياكل أو العلاقات داخل البيانات. يعد التجميع وتقليل الأبعاد والكشف عن الشذوذ من المهام الشائعة في التعلم غير الخاضع للإشراف. تتضمن الخوارزميات الشائعة في هذه الفئة تجميع الوسائل k وتحليل المكونات الرئيسية principal component analysis (PCA) ،
وشبكات الخصومة التوليدي (GANs) generative adversarial networks . وفي التعلم غير الخاضع للإشراف، تتعلم الآلة من البيانات التي لا تعرف نتائجها. يتم إعطاء عينات إدخال، ولكن لا توجد عينات إخراج. على سبيل المثال، تخيل أن لديك مجموعة من المستندات التي ترغب في تنظيمها. على سبيل المثال، قد تكون بعض المستندات عن الرياضة، والبعض الآخر عن التاريخ، والبعض الآخر عن الفنون. بالنظر إلى مجموعة المستندات فقط، فإن الهدف هو تعلم كيفية تجميعها في أنواع تلقائيًا.
بالنسبة للتجميع: يتم توفير المدخلات فقط (البيانات التي يسعى المرء إلى تنظيمها) في بيانات العينة. لم يتم توفير أي إخراج صريح. قد يقوم النموذج بتجميع المستندات الرياضية في مجموعة واحدة ووثائق التاريخ في مجموعة أخرى، ولكن لم يتم إخباره صراحةً كيف تبدو وثيقة الرياضة أو التاريخ، حيث لم يتم عرض عينة بيانات الإخراج مطلقًا. في الواقع، بمجرد اكتمال التجميع، لا يزال النموذج لا يعرف ما هي الوثيقة الرياضية أو التاريخية. كل ما “يعرفه” النموذج هو أن المدخلات في المجموعة “أ” متشابهة مع بعضها البعض، وكذلك المدخلات في المجموعة “ب “. وعلى البشر أن ينظروا إلى المجموعات ويقرروا ما إذا كانت منطقية أم لا وكيف.
يعد التعلم غير الخاضع للرقابة أقل شيوعًا في بيئات الأعمال العملية، ولكنه جذاب: فأنت لا تحتاج إلى بيانات مصنفة ويمكنك تجنب الجهد البشري وتكلفة القيام بذلك. من المحتمل أن يكون التعلم غير الخاضع للرقابة قابلاً للتطبيق في العديد من المجالات، لأنه لا يقتصر على التطبيقات ذات البيانات المصنفة.
التعلم شبه الخاضع للإشراف
في التعلم شبه الخاضع للإشراف، يجمع علماء البيانات بين التعلم الخاضع للإشراف من وجهة نظر الحصول على البيانات للتعلم وبين التعلم غير الخاضع للإشراف الذي يعد بسيط نسبيًا فيستخدم النموذج البيانات غير المسماة للحصول على فكرة عامة عن بنية البيانات، ثم يستخدم كمية صغيرة من البيانات المسماة لمعرفة كيفية تجميع البيانات وتنظيمها ككل. يُشار إليه أحيانًا باسم “التعلم الضعيف”.
تتمثل ميزة هذا النهج في أنه غالبًا ما يتم تقليل كمية البيانات المصنفة اللازمة لتعلم نموذج جيد، حيث توجد فرصة للتعلم من المعلومات السياقية التي توفرها البيانات غير المسماة.
وكما رأينا، فإن المهام الخاضعة للإشراف وغير الخاضعة للإشراف لها متطلبات مختلفة للبيانات
التعلم الخاضع للإشراف هو الشكل الأكثر انتشارًا لتعلم الآلة وهو الأسهل أيضًا. ومع ذلك، فإن التعلم غير الخاضع للإشراف لا يتطلب الكثير من البيانات وله حالات الاستخدام الأكثر عملية.
يحتوي التعلم الآلي على مجموعة واسعة من التطبيقات في مختلف المجالات. يتم استخدامه في التعرف على الصور والكلام، ومعالجة اللغة الطبيعية، وأنظمة التوصية، واكتشاف الاحتيال، والنمذجة المالية، والرعاية الصحية، والعديد من المجالات الأخرى حيث تكون الرؤى والتنبؤات المستندة إلى البيانات ذات قيمة.
وبشكل عام، يمكّن التعلم الآلي أجهزة الكمبيوتر من التعلم من البيانات واتخاذ قرارات أو تنبؤات ذكية، مما يفتح الفرص للأتمتة والتحسين وتحسين عملية صنع القرار في العديد من التطبيقات والصناعات.
بعد أن تحدثنا عن الثلاث أنواع الرئيسية لتصميم خوارزميات التعلم الآلي سننتقل لأفكار جديدة ومنها:
- Transfer Learning نقل التعلم:
نقل التعلم هو في الأساس نقل المعرفة من مهمة إلى أخرى. فإذا تعلم الطفل كيفية لعب البيسبول، فإن جوانب ما يتعلمه ستساعده أيضًا في لعب كرة الركل.
مثال على تعلم الآلة هو تدريب نموذج لتصنيف صور القطط والكلاب والجداول وما إلى ذلك، ربما باستخدام مجموعة بيانات ImageNet الشهيرة التي تضم ملايين الصور. بمجرد تدريب النموذج على القيام بذلك، يمكن بعد ذلك استخدام جزء كبير من النموذج لمهمة مختلفة تمامًا مثل تحديد الأورام في صورة الأشعة السينية.
في هذه الحالة يمكن إعادة استخدام جزء كبير من النموذج السابق ومن ثم تخصيص الجزء المتبقي من النموذج للمهمة الجديدة المحددة محل الاهتمام. لقد اتضح أن الميزات التي تم تعلمها لمهمة واحدة، مثل تصنيف القطط والكلاب، يمكن أن تكون مفيدة أيضًا في العثور على الأورام، على سبيل المثال. الضبط الدقيق مطلوب بالطبع، وضبط الأوزان بحيث تصبح الآن أكثر ملاءمة للمهمة الجديدة. ولكن في نقل التعلم، فإن البدء من الحل إلى المهمة الأولى سيحصل على حل أفضل وأسرع من البدء من الصفر.
يمكن أن يؤدي نقل التعلم إلى تقليل كمية البيانات المطلوبة لمهمة جديدة بشكل كبير، وهو ما يمثل فائدة تجارية محتملة. أخبر أحد المسؤولين التنفيذيين أن لديك كاشفًا رائعًا للصور يتطلب التدريب على مليون صورة، وقد يشعر المدير التنفيذي باليأس لأنه ليس لديه مليون صورة، ناهيك عن القدرة على تصنيفها جميعًا. والشيء الجميل في نقل التعلم هو أنك لا تحتاج إلى مليون صورة. قد تكون بالآلاف أو عشرات الآلاف فقط بدلاً من ذلك. باستخدام شبكة مدربة مسبقًا، لا يزال بإمكاننا الحصول على حل جيد بشكل أسرع وأفضل مما لو كنا نحاول تدريبه على بياناتك فقط.
مثال آخر على نقل التعلم يحدث مع معالجة اللغة الطبيعية، والذي يحدث عندما تقوم الآلات بمعالجة النص. بعد أن يتعلم النموذج الأولي اللغة والقواعد والتهجئة وما إلى ذلك، يمكن نقل هذا التعلم إلى مهام مثل المشاعر أو التصنيف.
ومع ذلك، هناك كلمة تحذير: لا تفترض أن المهام التي يمكن للبشر أن ينقلوا تعلمهم إليها بسهولة هي بالضرورة جاهزة للتعلم عن طريق النقل الآلي. ليس الأمر واضحًا دائمًا. في حين أنه من السهل جدًا كإنسان تجسيم الآلات، إلا أن الآلات ليست بشرًا، وهي تتعلم بطريقة مختلفة تمامًا.
- Reinforcement Learning التعليم المعزز:
تذكر أن التعلم الخاضع للإشراف يتطلب أمثلة للمدخلات والمخرجات.
يشبه التعليم المعزز التعلم غير الخاضع للإشراف، بمعنى أن المخرجات لا يتم تقديمها عادة.
يعتمد المفهوم المركزي للتعليم المعزز على “الوكيل” (جهاز كمبيوتر أو روبوت) الذي يتفاعل مع “البيئة” (يتم تعريفه هنا على أنه كل شيء ليس الوكيل).
ينفذ الوكيل إجراءات على البيئة (على سبيل المثال، يأخذ الروبوت خطوة إلى الأمام). بعد ذلك، ستوفر البيئات بعد ذلك نوعًا من التعليقات للوكيل، عادةً في شكل يسمى “المكافأة”.
عندما نقول “مكافأة”، لا نعني أننا نعطي الآلة دفعة من الإلكترونات. نحن حرفيًا نضيف فقط إلى عداد المكافآت الخاص بالبرنامج. هدف الوكيل هو تعظيم العدد الموجود في هذا العداد. ومع ذلك، فمن الأهمية بمكان أن لا أحد يخبر الوكيل عن كيفية تعظيم المكافأة أو يشرح سبب حصوله على المكافأة. هذا ما يكتشفه الوكيل بنفسه من خلال اتخاذ الإجراءات ومراقبة بيئته.
في العديد من أشكال التعليم المعزز، لا يعرف الوكيل ما هو الهدف لأنه لا يملك أمثلة للنجاح. كل ما يعرفه هو ما إذا كان سيحصل على المكافأة أم لا.
إن التعليم المعزز له أصداء من علم النفس البشري، فالدماغ يختبر شيئًا جيدًا واندفاع الدوبامين يجعل الشخص يريد المزيد منه. تجربة سيئة، مثل لمس موقد ساخن، تسبب الألم الذي يثني الشخص عن تكرار السلوك. ومع ذلك، على الرغم من أوجه التشابه مع علم النفس البشري، فإن إضفاء الطابع الإنساني عليه أكثر من اللازم هو خطأ.
- Overfitting التجهيز الزائد:
يحاول علماء البيانات جاهدين جعل بيانات التدريب مماثلة للعالم الحقيقي قدر الإمكان. بخلاف ذلك، من الممكن بناء نموذج يعمل على زيادة الأداء لبيانات التدريب ولكنه غير مناسب لأي شيء آخر. وهذا ما يسمى التجهيز الزائد.
للتوضيح، دعونا نأخذ مثالا متطرفا. يمكن لعالم البيانات الكسول إنشاء كاشف لصور الكلاب/القطط باستخدام جدول بحث بسيط: بالنظر إلى هذا الإدخال المحدد، قم بإنتاج هذا الناتج المحدد. إذا كان لدى عالم البيانات ألف صورة مصنفة للكلاب/القطط ووضع كل واحدة منها في جدول البحث، فيمكنه إنشاء نظام تصنيف “مثالي” دون الحاجة إلى التعلم الآلي. عندما يرى النظام مجموعة دقيقة من وحدات البيكسل، فإنه يعرف ما الذي يجب تسميته بها.
وغني عن القول إن هذا سيكون نظامًا فظيعًا، فهو لن يعمل إلا مع بيانات الصورة التي يعرفها بالفعل. قم بتغيير بكسل واحد فقط، ولن يتعرف النظام على الكلب بعد الآن. هذا أمر مبالغ فيه: النموذج يناسب تمامًا بيانات التدريب (1000 صورة مصنفة) ولكن ليس العالم الحقيقي (أي صور أخرى للكلب).
ولحسن الحظ، لا نعرف أي علماء بيانات مثل هذا. التجاوز في الممارسة العملية ليس واضحًا تمامًا، لكنه لا يزال مصدر قلق كبير.
خذ بعين الاعتبار رسمًا بيانيًا يوضح مساحة المنزل المربعة على المحور X وسعره على المحور Y. تخيل بعض نقاط البيانات المرسومة على الرسم البياني. يمكن تمثيل العلاقة بين اللقطات المربعة والسعر بكل بساطة كخط مستقيم.
لكن هذا الخط لن يكون مثاليًا في الواقع، قد يفتقد جميع نقاط البيانات الفعلية. فكر مرة أخرى في دروس الجبر، وستتذكر أنه يمكن تمثيل هذه الدالة الخطية بالشكل y = mx + b.
يُطلق على m وb اسم المعلمات – قم بتغييرها، وستتغير طبيعة الخط.
يمكنك إضافة المزيد من المعلمات لإنشاء وظيفة أكثر تعقيدًا لتناسب البيانات بشكل أفضل. على سبيل المثال، إليك دالة حيث y = ax2 + bx + c. يمكنك أن ترى أنه باستخدام ثلاث معلمات، يتطابق المنحنى بشكل أكثر إحكامًا مع بياناتك.
بالنظر إلى هذا الاتجاه، يمكنك بطبيعة الحال الاستمرار في زيادة عدد المعلمات حتى يتناسب خطك بدقة مع كل نقطة من بيانات التدريب الخاصة بك.
لكن المنطق السليم يخبرك أن هذا الخط لا يمثل تمثيلًا حقيقيًا لأسعار المساكن في العالم الحقيقي. لقد قمنا ببناء نموذج يعمل فقط مع بيانات التدريب الخاصة بنا ولكن هذا لا يمكن تعميمه. لن تقع بيانات العالم الحقيقي بدقة على منحنى سلس. قد يبدو كحل مصقول، لكنه أفضل قليلاً من طاولة البحث عن الكلاب والقطط.
الخاتمة
لقد تناولنا الكثير من الأمور في هذه المقالة كتقنيات التعلم الآلي، والتجهيز الزائد، وغيره , ربما نكون قد بدأنا أيضًا في فهم بعض التعقيد الذي يتعامل معه علماء ومهندسو البيانات أثناء قيامهم ببناء أنظمة تستخدم التعلم الآلي، خاصة في المؤسسات التي لم تفعل ذلك من قبل.
علم البيانات ليس سحرًا – والآن بعد أن رأينا ما وراء الستار، فنحن مستعدون بشكل أفضل للمساعدة في وضعه موضع التنفيذ.
المراجع:
- https://medium.com/machine-learning-in-practice/a-gentle-introduction-to-machine-learning-concepts-cfe710910eb
- https://www.google.com/search?q=%22A+Gentle+Introduction+to+Machine+Learning%3A+Concepts+and+Applications%22&oq=%22A+Gentle+Introduction+to+Machine+Learning%3A+Concepts+and+Applications%22&gs_lcrp=EgZjaHJvbWUyBggAEEUYOdIBCTE1MjFqMGoxNagCALACAA&sourceid=chrome&ie=UTF-8
- https://en.wikipedia.org/wiki/Machine_learning