MLOps - معدل 80000 فرك. من أوتوس التدريب 5 أشهر تاريخ 30 نوفمبر 2023.
Miscellanea / / November 30, 2023
سوف تتقن جميع مهارات التعلم الآلي اللازمة لتدفق البيانات والبيئات الموزعة. يتضمن البرنامج المعرفة اللازمة من مجالات علوم البيانات وهندسة البيانات، والتي ستسمح لك بمعالجة البيانات الضخمة وكتابة الخوارزميات الموزعة في Spark.
سوف تتدرب على كل وحدة من خلال استكمال الواجبات المنزلية. في نهاية التدريب، سيكون لديك مشروع نهائي يسمح لك بتلخيص كل المعرفة التي اكتسبتها وإضافتها إلى محفظتك. يمكن القيام بذلك كجزء من مهام العمل على مجموعة البيانات الخاصة بك أو أن يكون مشروعًا تعليميًا يعتمد على البيانات المقدمة من OTUS.
لمن هذه الدورة؟
لمتخصصي التعلم الآلي أو مهندسي البرمجيات الذين يرغبون في تعلم كيفية العمل مع البيانات الضخمة. عادة، توجد مثل هذه المهام في شركات تكنولوجيا المعلومات الكبيرة التي لديها منتج رقمي واسع النطاق.
لعلماء البيانات الذين يرغبون في تعزيز مجموعة مهاراتهم بالمهارات الهندسية. بفضل الدورة، ستتمكن من معالجة البيانات وعرض نتائج حلول ML في الإنتاج بشكل مستقل.
للتعلم، سوف تحتاج إلى مهارات علم البيانات الأساسية. نقترح عليك إلقاء نظرة على دورات خريطة علوم البيانات في OTUS لمعرفة المستوى المطلوب من التدريب.
سوف تتعلم:
- استخدام أدوات خط أنابيب ML القياسية في بيئة موزعة؛
- تطوير الكتل الخاصة بك لخطوط أنابيب ML؛
- تكييف خوارزميات تعلم الآلة مع البيئات الموزعة وأدوات البيانات الضخمة؛
- استخدم Spark وSparkML وSpark Streaming؛
- تطوير خوارزميات لإعداد البيانات المتدفقة للتعلم الآلي؛
- ضمان مراقبة الجودة في جميع مراحل انتقال حلول تعلم الآلة إلى التشغيل الصناعي.
الطلب على المتخصصين
المهارات التي ستتقنها هي مهارات تطبيقية وواعدة قدر الإمكان. تظهر المزيد والمزيد من المنتجات الرقمية في السوق، والتي يتطلب تطويرها العمل مع البيانات الضخمة ومعالجة التدفق. بالفعل، يمكن للمتخصصين الذين يتمتعون بمثل هذه المجموعة من المهارات وبعض الخبرة العملية أن يتأهلوا للحصول على راتب قدره 270 ألفًا. روبل اتجاه آخر هو أن أتمتة عمليات التدريب والتحقق من الصحة، على العكس من ذلك، تقلل بطريقة ما من قيمة عمل عالم البيانات الكلاسيكي. كل شيء يتجه نحو النقطة التي يمكن حتى لغير المتخصص أن يتنبأ بها. لذلك، فإن أولئك الذين لديهم مهارات هندسية سطحية على الأقل هم بالفعل في حالة ممتازة.
مميزات الدورة
الكثير من التدريب على العمل مع البيانات
مجموعة واسعة من المهارات بدءًا من تعلم الآلة الموزع ومعالجة البيانات المتدفقة وحتى مخرجات الإنتاج
الأدوات والتقنيات الحالية: Scala، Spark، Python، Docker
التواصل المباشر مع الخبراء عبر الندوات عبر الإنترنت ودردشة Slack
4
دورةالمشاركة في تطوير فريق علوم البيانات الذي يوفر وظائف تعتمد على التعلم الآلي لمنتجات الشركة وخدماتها. بصفته عالم بيانات، شارك في تطوير Kaspersky MLAD وMDR AI Analyst. في...
المشاركة في تطوير فريق علوم البيانات الذي يوفر وظائف تعتمد على التعلم الآلي لمنتجات الشركة وخدماتها. بصفته عالم بيانات، شارك في تطوير Kaspersky MLAD وMDR AI Analyst. بصفته مطور C++، شارك في إنشاء MaxPatrol SIEM، وقام بتدريس الكمبيوتر لسنوات عديدة. التخصصات العلمية في MSTU GA. مؤلف سلسلة من التقارير حول إدارة وتطوير مشاريع ML وC++ وDS فرق. عضو مؤتمر الكمبيوتر C++ روسيا. مدير البرنامج
8
الدوراتأكثر من 20 عامًا من الخبرة في مشاريع التطوير المخصصة في مجال تكنولوجيا المعلومات. عشرات المشاريع الناجحة، بما في ذلك المشاريع الخاضعة لعقود حكومية. خبرة في تطوير وتنفيذ أنظمة تخطيط موارد المؤسسات (ERP) والحلول مفتوحة المصدر ودعم التطبيقات عالية التحميل. مدرس دورات...
أكثر من 20 عامًا من الخبرة في مشاريع التطوير المخصصة في مجال تكنولوجيا المعلومات. عشرات المشاريع الناجحة، بما في ذلك المشاريع الخاضعة لعقود حكومية. خبرة في تطوير وتنفيذ أنظمة تخطيط موارد المؤسسات (ERP) والحلول مفتوحة المصدر ودعم التطبيقات عالية التحميل. مدرس دورات تدريبية على Linux وKuber وMLOps وDataOps وSolutionArchitect وIaC وSRE، بالإضافة إلى مرشد دورة HighLoad
1
حسنًامتخصص في العمل مع البيانات الضخمة والتعلم الآلي. لمدة 8 سنوات كان يعمل في Odnoklassniki.ru. أدار فريق OK Data Lab (مختبر للباحثين في مجال البيانات الضخمة والآلات...
متخصص في العمل مع البيانات الضخمة والتعلم الآلي. لمدة 8 سنوات كان يعمل في Odnoklassniki.ru. أدار فريق OK Data Lab (مختبر للباحثين في مجال البيانات الضخمة والتعلم الآلي). أصبح تحليل البيانات الضخمة في Odnoklassniki فرصة فريدة للجمع بين التدريب النظري والأساس العلمي مع تطوير منتجات حقيقية حسب الطلب. منذ عام 2019، يعمل في سبيربنك كمدير إداري. يعمل كقائد للمجموعة لتطوير منصة لأنظمة التوصية في قسم التخصيص الشامل. تخرج من جامعة سانت بطرسبورغ الحكومية عام 2004، حيث دافع عن درجة الدكتوراه في الأساليب المنطقية الرسمية عام 2007. عملت في مجال الاستعانة بمصادر خارجية لمدة 9 سنوات تقريبًا دون أن أفقد الاتصال بالجامعة والبيئة العلمية.
مقدمة أساسية لبدء الدورة
-الموضوع 1. النسب المتدرج والنماذج الخطية
-الموضوع 2. نظرة عامة على أساليب ومقاييس التعلم الآلي الأساسية
-الموضوع الثالث: تطور أساليب التعامل مع البيانات
-الموضوع الرابع: أساسيات البرمجة في سكالا
الأساس التكنولوجي لمعالجة البيانات الموزعة
-الموضوع 5. أنظمة الملفات الموزعة
-الموضوع السادس. مديرو الموارد في الأنظمة الموزعة
-الموضوع 7. تطور أطر الحوسبة المتوازية والموزعة على نطاق واسع
-الموضوع 8. أساسيات أباتشي سبارك 1
-الموضوع 9. أساسيات أباتشي سبارك 2
أساسيات ML الموزعة
-الموضوع 10. نقل خوارزميات ML إلى بيئة موزعة
-الموضوع 11.ML في أباتشي سبارك
-الموضوع الثاني عشر: تطوير الكتل الخاصة بك لـSparkML
-الموضوع 13.تحسين المعلمات الفائقة وAutoML
معالجة الدفق
-الموضوع الرابع عشر. معالجة بيانات الدفق
-الموضوع 15. مكتبات الطرف الثالث للاستخدام مع Spark
-الموضوع 16.Spark الجري
-الموضوع السابع عشر. التدفق المنظم والمستمر في سبارك
-الموضوع الثامن عشر.أطر البث البديلة
تحديد الأهداف وتحليل النتائج
-الموضوع 19. تحديد هدف مشروع ML والتحليل الأولي
-الموضوع 20. أهداف التعلم الآلي على المدى الطويل باستخدام مثال مهمة الحد من الاضطراب
-الموضوع 21.اختبار أ/ب
-الموضوع 22. مواضيع إضافية
إخراج نتائج ML إلى الإنتاج
-الموضوع 23. طرق إدخال حلول تعلم الآلة في الإنتاج
-الموضوع 24. الإصدار والاستنساخ والمراقبة
-الموضوع 25. خدمة النماذج عبر الإنترنت
-الموضوع السادس والعشرون. أنماط التدفق غير المتزامن ML وETL
-الموضوع 27. إذا كنت بحاجة إلى بايثون
ML في بايثون في الإنتاج
-الموضوع الثامن والعشرون: كود الإنتاج في بايثون. كود التنظيم والتعبئة
-الموضوع 29.هندسة REST: Flask API
-الموضوع 30.Docker: البنية والتطبيق والنشر
-الموضوع 31.Kubernetes، تنسيق الحاويات
-الموضوع 32.أدوات MLOPS لـ Kubernetes: KubeFlow، Seldon Core. ميزات تشغيل الأنظمة غير المتجانسة في الصناعة.
-الموضوع 33. أمازون ساجيماكر
-الموضوع 34.خدمة AWS ML
مواضيع متقدمة
-الموضوع 35. الشبكات العصبية
-الموضوع 36. التعلم الموزع واستدلال الشبكات العصبية
-الموضوع 37. تعزيز التدرج على الأشجار
-الموضوع 38. التعلم المعزز
مشروع العمل
-الموضوع 39. اختيار الموضوع وتنظيم عمل المشروع
-الموضوع 40. التشاور بشأن المشاريع والواجبات المنزلية
-الموضوع 41. حماية أعمال التصميم