معالجة وتحليل البيانات الضخمة - دورة مجانية من التعليم المفتوح، التدريب لمدة أسبوعين، حوالي 36 ساعة أسبوعيًا، التاريخ 29 نوفمبر 2023.
Miscellanea / / November 30, 2023
دكتوراه. المنصب: أستاذ مشارك، كلية أنظمة التحكم والروبوتات، أستاذ مشارك، المدرسة العليا للثقافة الرقمية، جامعة ITMO
مرشح العلوم الفيزيائية والرياضية المنصب: أستاذ مشارك، المدرسة العليا للثقافة الرقمية، جامعة ITMO
دكتوراه. المنصب: أستاذ مشارك، المدرسة العليا للثقافة الرقمية، جامعة ITMO
الوحدة الأولى الموضوع 1.1 مقدمة في علم البيانات يناقش أنواع ومصادر البيانات والمبادئ فصل البيانات ودمجها، أنواع المقاييس، طرق تنظيف البيانات وسد الثغرات، التحكم نطاقات. الموضوع 1.2 أدوات معالجة البيانات يناقش أدوات معالجة البيانات الأساسية، مثل جداول البيانات (جداول بيانات Google و Excel) ويغطي مسائل فرز وتصفية البيانات ووسائل تجميع وتحليل البيانات الجدولية (الجداول المحورية) الموضوع 1.3 التصور البيانات مهام وطرق تصور البيانات في الأدوات المختلفة (جداول بيانات Google وExcel)، وأشكال العرض الكمية والبيانات البيانات النوعية. يعتبر تصور البيانات المعرفية. الموضوع 1.4 تحليل البيانات وتحويلها يتم النظر في طرق تجانس البيانات وتطبيعها وقضايا تحويل البيانات. يتم وصف أنواع الإحصائيات الوصفية وطرق حسابها بالتفصيل. الموضوع 1.5 العمل مع السلاسل الزمنية يتم النظر في مبادئ العمل مع السلاسل الزمنية وطرق تحليلها. يتم إيلاء اهتمام خاص لتقنيات تجانس السلاسل الزمنية، وتحديد الاتجاهات والمكونات الموسمية للسلاسل الزمنية.
الوحدة 2 موضوع تخزين البيانات الضخمة 2.1. أنظمة إدارة قواعد البيانات يتم النظر في بنية نظم المعلومات والوظائف الرئيسية لأنظمة إدارة قواعد البيانات. الموضوع 2.2. تصميم البيانات المنظمة تؤخذ في الاعتبار المفاهيم الأساسية للنموذج العلائقي (الجدولي). البيانات، وتصميم البيانات في نموذج علائقي، وقواعد إنشاء الجداول وتحديد قيود التكامل. الموضوع 2.3. SQL - استعلامات البيانات وكائنات قاعدة البيانات يتم أخذ مبادئ بناء استعلامات البيانات في لغة SQL بعين الاعتبار، بما في ذلك الإسقاط، والفرز، وتحديد شروط الاختيار، والانضمام إلى جداول متعددة، وعمليات المجموعة النظرية، والمتداخلة طلبات. تناقش المحاضرة أيضًا كائنات قاعدة البيانات - المشاهدات والإجراءات/الوظائف والمشغلات. تم تقديم مفهوم الفهارس، والذي يمكن أن يحسن كفاءة تنفيذ عدد من الاستعلامات. الموضوع 2.4. تخزين NoSQL تعتبر المفاهيم والخصائص الأساسية لأنظمة NoSQL، والأنواع المختلفة وتقييمات أنظمة NoSQL: القيمة الرئيسية، والمستند، والعمود، والرسم البياني. مبادئ بناء الاستعلامات على البيانات في مخازن NoSQL. الموضوع 2.5. MongoDB - العمل مع تخزين المستندات يناقش تنظيم البيانات وبناء الاستعلامات في MongoDB. يتم توفير أمثلة لبناء الاستعلامات في قاعدة بيانات MongoDB التجريبية.