الأساليب الحديثة لإدارة البيانات - الدورة 27900 روبل روسي. من مركز تدريب IBS مدة التدريب 16 ساعة التاريخ 26 نوفمبر 2023.
Miscellanea / / December 02, 2023
عند تصميم التطبيقات، أحد القرارات المهمة هو كيفية تخزين البيانات. لعدة عقود، كانت أنظمة إدارة قواعد البيانات العلائقية هي الخيار الأول والوحيد؛ اختلفت المشاريع فقط في درجة التطبيع، وموقع منطق الأعمال، وما إلى ذلك. آخر منها بعد عشرة إلى خمسة عشر عامًا، ازدهرت الأنظمة البديلة بسرعة - بدءًا من أنظمة إدارة قواعد البيانات الموجهة للكائنات والموجهة نحو المستندات وحتى أنظمة الملفات الموزعة وأنظمة معالجة التدفق بيانات. تتناول الدورة مجموعة من الحلول الحديثة التي تسمح بالتخزين الآمن للبيانات على المدى الطويل، أسباب ظهور حلول الفئات المختلفة ومزاياها وعيوبها وطرقها المفضلة يستخدم.
المواضيع التي تمت تغطيتها:
1. تطور أساليب تخزين البيانات (نظرية – ساعتان).
قواعد البيانات، مستودعات البيانات، محركات قواعد البيانات، البنى المتوازية على نطاق واسع، التقارب الفائق.
2. النموذج العلائقي (نظرية – ساعتان).
ما هي المشاكل التي يحلها، وبأي تكلفة؟
النسخ المتماثل والمشاركة والمعاملات الموزعة.
3. نموذج الحد الأدنى للقيمة الرئيسية (النظرية – ساعة واحدة، الممارسة – ساعة واحدة).
خيارات هيكل المفتاح، خيارات هيكل القيمة، واجهات البرمجيات.
كفاءة استخدام قواعد البيانات غير العلائقية: الشروط الضرورية والكافية [Cassandra، HBase].
4. النموذج المستندي [MongoDB] (النظرية – 0.5 ساعة، الممارسة – 0.5 ساعة).
5. أنظمة الملفات الموزعة بدلاً من نماذج البيانات: البنية العنقودية [HDFS] (نظرية - ساعة واحدة، ممارسة - ساعة واحدة).
6. لغة SQL عبر أنظمة الملفات الموزعة (النظرية – ساعة واحدة، الممارسة – ساعتان).
خيارات البنية، تنسيقات الملفات، القيود، المعاملات [Hive، Spark، Spark SQL، Parquet، ORC].
7. أنظمة تخزين البيانات الموزعة في ذاكرة الوصول العشوائي [Hazelcast، Ignite، Tarantool] (نظرية - ساعة واحدة).
8. أنظمة OLAP الموزعة [Clickhouse, Druid] (نظرية - ساعة واحدة).
9. معالجة تدفقات البيانات [Spark Streaming] (نظرية – ساعة واحدة).
10. قواعد البيانات ذاتية التكوين والمستقلة (نظرية - ساعة واحدة).