التعلم الآلي على البيانات الضخمة - دورة مجانية من Open Education، التدريب 5 أسابيع، من 5 إلى 14 ساعة أسبوعيًا، التاريخ: 3 ديسمبر 2023.
Miscellanea / / December 08, 2023
المنصب: مهندس حلول الحشود، Neatsy, Inc.
بدأ العمل في المدرسة العليا للاقتصاد عام 2017. تقوم بتدريس دورات في محو الأمية الرقمية، وتحليل النص، وأدوات وتقنيات التعامل مع كميات كبيرة من المعلومات النصية. الاهتمامات المهنية: تحليل البيانات الضخمة التعليم 2018 درجة البكالوريوس: الجامعة الوطنية للبحوث المدرسة العليا للاقتصاد، تخصص "الرياضيات التطبيقية وعلوم الكمبيوتر"
1. إعداد البيانات للتدريب
اليوم، يعمل التعلم الآلي بفعالية عندما يكون لدينا كميات كبيرة من البيانات المصنفة. سنلقي نظرة هذا الأسبوع على تنسيقات البيانات والعلامات الموجودة وكيفية جمع هذه العلامات
2. تدريب النماذج الكلاسيكية على البيانات الضخمة
سنتعلم هذا الأسبوع كيفية تدريب الخوارزميات الكلاسيكية (النماذج الخطية وأشجار القرار) على البيانات الضخمة.
3. بناء أنظمة التوصية
سننظر في كيفية موازنة الخوارزميات الكلاسيكية المستخدمة في أنظمة التوصية.
4. تحليل كميات كبيرة من المعلومات النصية
دعونا ننظر في مشاكل التعلم الآلي على النصوص. دعونا نتحدث عن المعالجة المسبقة للنص، وكيفية الحصول على تمثيل منظم للبيانات النصية باستخدام نماذج مثل word2vec وBERT.
5. تدريب الشبكات العصبية العميقة
سوف نتعلم كيفية موازاة تدريب الشبكات العصبية الحديثة، وكيفية عمل Horovod وParameter Server بالداخل، وسنتحدث عن نقل التعلم.