ما هو التعلم النشط وكيف يعمل؟

التعلم النشط هو أسلوب التعلم الآلي (ML) حيث يمكن للخوارزمية تحديد البيانات التي تريد التعلم منها. في التعلم النشط ، تختار الخوارزمية أي مجموعة فرعية من الأمثلة لتسميتها بعد ذلك من مجموعة البيانات غير المصنفة سابقًا. يختلف التعلم السلبي من حيث أن المستخدم يعطي جميع المعلمات المعروفة مثل تسميات التدريب دون التفكير في مدى فائدة ذلك للتنبؤ في المستقبل.

Jan 30, 2022 - 03:53

الفكرة الأساسية وراء خوارزمية المتعلم النشط هي أن خوارزمية ML قد تحقق مستوى أعلى من الدقة أثناء العمل مع عدد أقل من ملصقات التدريب إذا أعطيت حرية اختيار البيانات التي ترغب في تعلمها. قد يستخدم البرنامج هذا الأسلوب للاستعلام عن مصدر موثوق ، مثل مجموعة بيانات مسماة ، من أجل الحصول على التنبؤ الصحيح لمشكلة معينة.

الهدف من أسلوب التعلم التكراري هذا هو تسريع التعلم عن طريق تقليل مقدار الوقت الذي يقضيه في إعداد البيانات وضبط الخوارزمية. المفاضلة هي أن خوارزمية المتعلم النشط تستغرق عادةً وقتًا أطول للعثور على أفضل ملصقات التدريب.

متطلبات التعلم النشط

من أهم الاعتبارات عند استخدام التعلم النشط جودة البيانات. لكي تكون فعالة ، يجب أن تكون البيانات موزعة جيدًا عبر فئات مختلفة حتى تتمكن الخوارزمية من تحديد الأمثلة ذات الصلة بسهولة. إذا لم يتم توزيع البيانات بشكل جيد ، فقد يكون من الصعب على الخوارزمية العثور على أمثلة جيدة لكل فئة ، مما قد يؤدي إلى ضعف الأداء في التنبؤات اللاحقة.

كيف يعمل التعلم النشط

يعمل التعلم النشط عن طريق إعطاء الخوارزمية نقطة انطلاق للبيانات المصنفة. يسمى هذا الاختيار الإجباري مثيلًا نشطًا ، وهدف المتعلم هو اختيار أقل عدد ممكن. فكلما زاد الاختيار ، زادت مخاطر تسمية الأمثلة الخاطئة وتدهور أدائها في التنبؤات المستقبلية.

تعد خوارزميات التعلم النشط أفضل في التعلم من مجموعات البيانات مع الكثير من عدم اليقين. هذا لأنهم يركزون على الحالات التي من المرجح أن تؤدي إلى تنبؤات أفضل. الأنواع الأربعة الأكثر شيوعًا من خوارزميات التعلم النشط هي أخذ العينات الانتقائي ، والصقل التكراري ، وأخذ عينات عدم اليقين ، والاستعلام من قبل اللجنة. كل نوع له نقاط قوته وضعفه:

أخذ العينات الانتقائي - تختار الخوارزمية بشكل عشوائي عددًا صغيرًا من الحالات من مجموعة البيانات وتسميها. ثم يستخدم تلك الحالات لتدريب النموذج.
التصفية التكرارية - تبدأ الخوارزمية بتحديد مثيل عشوائي كمثيل نشط. ثم يقارن خطأ التنبؤ في هذا المثال بخطأ التوقع في جميع الحالات الأخرى في مجموعة البيانات. إذا عثر على تنبؤ أكثر دقة في مثيل آخر ، فإنه يعيد تصنيف هذا المثيل على أنه نشط ويكرر العملية.
أخذ عينات عدم اليقين - تختار الخوارزمية بشكل عشوائي عددًا صغيرًا من الحالات من مجموعة البيانات وتسميها. ثم يستخدم تلك الحالات لتدريب النموذج.
استعلام من قبل اللجنة - تبدأ الخوارزمية بتحديد مثيل عشوائي كمثيل نشط. ثم يقسم مجموعة البيانات إلى مجموعات ، حيث تحتوي كل مجموعة على حالات متشابهة. ثم يختار مثيلًا نشطًا واحدًا من كل مجموعة.

تابع: لماذا يجب على الذكاء الاصطناعي والتعلم الآلي تخويف المسوقين الرقميين؟

ما هي الطريقة الأفضل؟

لا توجد إجابة واحدة تناسب الجميع على هذا السؤال. ستعمل الطرق المختلفة بشكل أفضل مع النماذج المختلفة ، ولكل طريقة مزاياها وعيوبها. على سبيل المثال ، يعمل أخذ عينات عدم اليقين بشكل أفضل عندما يكون هناك العديد من الأمثلة التي تشبه جميعها إلى حد بعيد الحالة التي تحاول تصنيفها. إنه لا يعمل بشكل جيد بالنسبة للنماذج حيث تحتوي بعض حالات التدريب على معلومات أكثر من غيرها (على سبيل المثال ، الشبكات العصبية ).

التعلم النشط جيد أم سيئ

يعمل التعلم النشط بشكل أفضل عندما يكون من الممكن العثور على ممثل جيد لمجموعة البيانات (أي مجموعة بهامش مرتفع أو تعقيد منخفض). كما أنه يتناسب بشكل جيد مع عدد كبير من الأمثلة المصنفة مع الحفاظ على الموارد الحسابية من خلال التركيز على الأمثلة الأكثر إفادة أولاً. ومع ذلك ، فإنه يتطلب بعض المعرفة بالموضوع حول المهمة المطروحة من أجل اتخاذ قرار مستنير حول المثال الأفضل لوضع العلامات.

تكمن الفكرة وراء التعلم النشط في جعل المستخدم يختار أي مثال للتعليق عليه ، ومن ثم اختيار الأكثر إفادة.

أولاً ، دعنا نحدد ما هو المتعلم النشط - في سياق التعلم الآلي ؛ يشير إلى نموذج يساعد في تسمية بيانات تدريب الذكاء الاصطناعي من خلال الاستعلام عن مالكها. على سبيل المثال ، إذا كنت تحاول إنشاء جهاز كشف للرسائل غير المرغوب فيها ، فقد تتمثل إحدى الطرق في سؤال المستخدمين البشريين عما إذا كانت رسائل البريد الإلكتروني غير مرغوب فيها أم لا. ومع ذلك ، إذا كان بإمكانك أن تسأل مجموعة فرعية فقط من المستخدمين ، فسيكون هذا أسلوب تعلم نشطًا يسمى "أخذ العينات الانتقائية" ، لأنه يحدد الحالات بناءً على فائدتها المتوقعة في التصنيف.

تتمثل إحدى مزايا أخذ العينات الانتقائي على التغطية الكاملة في أنه يمكن أن يوفر الوقت والتكلفة مع تحقيق نفس الدقة أو دقة أفضل. تتمثل العيوب الرئيسية في أنه يتطلب أوراكل لمعرفة الفرق بين البيانات المهمة والبيانات الزائدة عن الحاجة ، وأنه لا يمكن تطبيقه إلا عندما يكون هناك ما يكفي من الملصقات في مكان آخر.

حالات استخدام التعلم النشط

لقد وجد التعلم النشط عددًا من التطبيقات في مجالات مثل تصنيف النص وتصنيف المستندات والتعرف على الصور. كما تم استخدامه للكشف عن السرطان واكتشاف الأدوية.

تصنيف النص

يعد تصنيف النص أحد أكثر تطبيقات التعلم النشط شيوعًا ، وهو مهمة تعيين فئة لجزء من النص. في هذا التطبيق ، تكون الفئات عادةً عبارة عن مجموعة من التصنيفات المحددة مسبقًا مثل "الأخبار" و "الرياضة" و "الترفيه" و "الرأي". الهدف هو تعيين كل جزء من النص تلقائيًا إلى إحدى هذه الفئات.

تصنيف الوثيقة

يمكن أيضًا استخدام التعلم النشط لتصنيف المستندات ، وهي مهمة تعيين فئة إلى مستند تلقائيًا. في هذا التطبيق ، تكون الفئات عادةً عبارة عن مجموعة من الملصقات المحددة مسبقًا مثل "مستند تقني" و "مستند تسويق" و "مستند قانوني".

التعرف على الصور

التعرف على الصور هو مجال آخر حيث يمكن استخدام التعلم النشط. في هذا المثال ، لدينا صورة ونود أن يقوم المعلقون بتسمية المناطق ذات الصلة فقط في الصورة. بمعنى آخر ، نحتاج إلى التأكد من أن كل منطقة مصنفة تساهم بأقصى قدر من المعلومات لتصنيف الصورة. لتحقيق هذا الهدف ، سوف يلتقط التعلم النشط المناطق الأكثر إثارة للاهتمام من البيانات غير الموسومة والسماح بمعالجتها بواسطة التعليقات التوضيحية.

بهذه الطريقة ، لا يضيع أصحاب التعليقات التوضيحية أي وقت في وضع علامات على الأجزاء الزائدة من الصورة التي كانت ستبقى بدون علامات إذا كانوا يقومون فقط بتعيين تسميات أعمى لجميع المناطق في الصورة.

تابع: كيفية التعرف على الوجوه عبر الإنترنت باستخدام الذكاء الاصطناعي؟

استنتاج

التعلم النشط عبارة عن تقنية تحدد فيها الآلة نفسها أهم نقاط البيانات التي يجب أن يقوم الإنسان بتسميتها. هذا له فوائد متعددة على الطرق التقليدية للتعلم الآلي. ومع ذلك ، لا يزال هناك الكثير من البحث الذي يتعين القيام به في هذا المجال من أجل تحديد المهام ومجموعات البيانات الأكثر ملاءمة لأساليب التعلم النشط.

أحد الأسئلة التي لا تزال دون إجابة هو ما إذا كان التعلم النشط يتفوق دائمًا على الأساليب التقليدية أم لا - لا يزال هذا سؤالًا مفتوحًا يتطلب مزيدًا من الدراسة. بالإضافة إلى ذلك ، ليس من الواضح أيضًا مدى جودة مقياس التعلم النشط مع زيادة أحجام البيانات. هناك حاجة إلى مزيد من العمل من أجل فهم أفضل لفوائد وقيود مناهج التعلم النشط. على الرغم من هذه الشكوك ، يعد التعلم النشط مجالًا واعدًا أظهر بالفعل إمكانات كبيرة لتحسين دقة نماذج التعلم الآلي.

الملخص - التعلم النشط: التعلم العميق هو نوع من التعلم الآلي الذي يسمح لأجهزة الكمبيوتر بالتعلم بمفردها. تُستخدم طرق التعلم العميق مثل التعلم النشط عادةً لحل المشكلات المعقدة للغاية باستخدام العديد من المتغيرات. من خلال التعلم النشط ، يمكن للآلة نفسها تحديد نقاط البيانات التي يجب تصنيفها ، مما يساعد على توفير الوقت والجهد.