اجمع قائمة تشغيل ، وابحث عن مسار عالق في رأسك ، واكتب مسرحية: ما يمكن أن يفعله الذكاء الاصطناعي بالموسيقى
Miscellanea / / March 30, 2022
التعرف على التراكيب
يمكن سماع مسار رائع في أي مكان: في مركز التسوق ، في المقهى ، وحتى من نافذة سيارة قريبة ، أثناء الوقوف في ازدحام مروري. حتى لا تفوت الأغنية غير المألوفة التي تحبها ، يكفي تشغيل تطبيق التعرف. يتم إعطاء اسم التكوين واسم الفنان فيها بواسطة الذكاء الاصطناعي في ثوانٍ. صحيح ، وراء هذه النتيجة السريعة ، هناك إعداد شامل: من أجل تعلم اللحن بسرعة ، يحتاج البرنامج أولاً إلى تذكره. للقيام بذلك ، يتم تقديم الشبكات العصبية إلى مكتبة ضخمة من المسارات ، ثم تقوم الخوارزميات بتحويل الصوت إلى مخطط طيفي وتحللها إلى وقت وتردد وكثافة.
اناتولي ستاروستين
رئيس خدمة تطوير التكنولوجيا في Yandex Media Services.
المخطط الطيفي هو رسم بياني. يقع الوقت على طول المحور الأفقي ، ويقع تردد الصوت على طول المحور الرأسي ، ويتم التعبير عن شدته في لحظة ثابتة بالألوان. يتم تمثيل الإشارة المنخفضة بشريط أحمر في الأسفل وإشارة عالية في الأعلى. والنتيجة هي صورة تتكون من خطوط أفقية ملونة. يساعد تحليل هذه الدوائر في التعرف على الموسيقى. عند العمل باستخدام الطيف ، يتم استخدام نفس نهج الشبكة العصبية كما هو الحال في تحليل الصور.
لنفترض أن شخصًا ما يسمع أغنية في الراديو ويريد معرفة الاسم والفنان. يقوم برنامج التعرف ببناء مخطط طيفي لممر السبر وإرساله إلى مكتبة المسارات الخاصة به. ثم يقارن "صورة" اللحن المرغوب مع مخططات الطيف للتركيبات الأخرى ويختار المطابقة الأكثر دقة. في الوقت نفسه ، يتعرف الذكاء الاصطناعي على اللحن حتى من خلال التداخل الشديد ، مثل ضوضاء الطريق أو الإصلاحات في شقة مجاورة.
بالمناسبة ، لا تستطيع الشبكة العصبية فقط تحديد الفنان واسم المسار العالق في الرأس ، ولكن أيضًا تحديد نوعه تقريبًا. للقيام بذلك ، يتم تعليم الذكاء الاصطناعي للعثور على أنماط في أنماط موسيقية مختلفة. عادة ما يتعذر الوصول إلى هذه الخصائص المحددة للبصر والسمع البشري. ولكن بفضل التعلم الآلي ، يصبح من الممكن حساب الأنواع الموسيقية من صور مخطط الطيف.
يوصي الأغاني
يبدو أن العثور على المسار "نفسه" الذي يناسب حالتك المزاجية في بلايين الأغاني بمفردك يكاد يكون مستبعدًا مثل الوقوع في الحب من النظرة الأولى. ولكن بفضل خوارزميات التوصية ، لا تحدث المطابقات المثالية كثيرًا. أولاً ، يبحث الذكاء الاصطناعي عن الأشخاص ذوي الأذواق المتشابهة ، ثم يتم ربط الصيغ الإحصائية: عدد الإعجابات ، وعدم الإعجاب ، والمسرحيات ، والتخطي لتركيبة معينة.
اناتولي ستاروستين
تعمل توصية الأغنية وفقًا لمخطط بسيط: إذا كان Vasya يحب المسار X ، ثم قام Petya أيضًا بتصنيفه ، فعندما يحب Vasya Y ، يجب على Petya أيضًا التوصية بالمسار Y. عندما تحتاج الخوارزمية إلى البحث عن الأغنية التالية ، يتم تطبيق الصيغة على مجموعة من الأغاني المحتملة. أنسب يطفو إلى الأعلى.
ينتشر المحتوى "البارد" ، غير المرئي في قوائم التشغيل الخاصة بالمستمع الشامل ، بشكل أبطأ. ولكن بفضل الشبكات العصبية ، لا يزال لدى الفنانين غير المعروفين والموسيقى المتخصصة فرصة ضئيلة في الظهور في سلسلة التوصيات. إذا قمنا بتبسيط جميع الفروق التقنية ، فيمكننا القول أنه في مثل هذه الحالات ، يكتشف الذكاء الاصطناعي عدد المرات يستمع مستخدم معين إلى الأغاني التي تحتوي على مخططات طيفية مماثلة ، ويدعوه بشكل دوري للتعرف على الأغاني الجديدة. المسارات.
ماري جو
مغني.
أحيانًا أبحث عن الإلهام في التوصيات. أعهد باختيار المقطوعة الموسيقية لخدمة الموسيقى ، والاستماع إلى الألحان ، والعثور على أصوات أو نصوص مثيرة للاهتمام. لذلك يمكنك حقًا أن تقع في حب مقطوعة موسيقية لفنان غير معروف. وهناك سطر آخر سمعته عن طريق الخطأ يمكن أن يدفعني إلى تأليف قصائد خاصة بي.
تساعد الشبكات العصبية أيضًا في إنشاء اختيارات موسيقية للياقة البدنية أو المشي أو النوم. يختار محررو المحتوى المسارات المرجعية للخوارزميات ، وبناءً على مخططاتهم الطيفية ، يوسع الذكاء الاصطناعي التوصيات الموضوعية.
توليد الموسيقى
في السابق ، كان الملحنون فقط هم من يمكنهم إنشاء الألحان. الآن أصبح من الممكن بدون مشاركة الموسيقيين. في عام 2020 ، استضافت هولندا أول مسابقة يوروفيجن للأغاني للشبكات العصبية - مسابقة الأغنية بالذكاء الاصطناعي. فاز الاسترالي تعاون الذكاء الاصطناعي مع حيوانات الكوالا وسمكة الملوك وشياطين تسمانيا. كانت الأغنية مخصصة لحرائق الغابات المستعرة في القارة. تم تسجيل أصوات الحيوانات في عينات قصيرة - شظايا من 1-2 ثانية. جمعتهم الخوارزمية مع ضربات جميع الفائزين السابقين في Eurovision الحقيقي ، وبعد ذلك قاموا بتجميع العينات في اللحن الخاص بهم.
ليس هذا هو المثال الوحيد لاتحاد إبداعي ناجح للمبرمجين والشبكات العصبية. في عام 2019 ، في ختام مهرجان الشتاء الدولي للفنون في سوتشي ، قدمت أوركسترا الدولة مقطوعة مدتها 8 دقائق. كتبه الملحن كوزما بودروف من أجزاء منفصلة من الألحان الناتجة عن الشبكات العصبية. اليوم ، يعد تأليف الموسيقى أكثر المجالات الواعدة لتطوير الذكاء الاصطناعي.
اناتولي ستاروستين
يمكن للذكاء الاصطناعي إنشاء الموسيقى بثلاث طرق. يتعلق الأول ببناء "طوب" عينات الصوت الجاهزة. في هذه الحالة ، تقوم الخوارزمية ببساطة بترتيبها بالترتيب الصحيح عبر العديد من المسارات الصوتية ، ويقوم المنظم الإلكتروني بمزج المسار النهائي. الطريقة الثانية هي إنشاء تدوين الموسيقى. إنه مثل كتابة التعليمات للموسيقي لتشغيل العمل النهائي عليه. والطريقة الثالثة هي تسجيل الإشارة الصوتية "الخام". في هذه الحالة ، تخلق الشبكة العصبية نفسها موجات صوتية مشابهة ، على سبيل المثال ، لموزارت أو فرقة البيتلز.
بالمناسبة ، يمكن للشبكات العصبية أيضًا كتابة الشعر للأغاني. حتى الآن ، تبدو مثل هذه المقطوعات غريبة نوعًا ما ، لذا لا ينبغي أن يقلق مؤلفو الأغاني بشأن البطالة. بالإضافة إلى ذلك ، فإن "عقل الكمبيوتر" خالي من المشاعر. لا يستطيع اختراق السياق العاطفي ونقل التجارب التي أجبرت مؤلفي الأعمال على الإبداع.
ماري جو
يدور الشعر والموسيقى في المقام الأول حول الروح والعالم الداخلي وتجارب ومشاعر وعواطف الناس. على سبيل المثال ، الأغنية الجديدة "لا تحترق" هي قصتي الشخصية ، ولكنها أيضًا تدور حول كل من يسعى وراء حلم ويحاول أن يفهم نفسه. لا أعتقد أن الذكاء الاصطناعي سيحل أبدًا محل الشخص الحي في صناعة الموسيقى. ولكن هنا يمكنك الحصول على ترادف مثير للاهتمام "شبكة بشرية عصبية". نحن نعرف بالفعل عشرات الأمثلة عندما ساعد الذكاء الاصطناعي الملحنين في إنشاء ألحان فريدة. في الواقع ، هذا اتجاه جديد في عالم الموسيقى ، وأنا متأكد من أنه سيكون له مستمع خاص به وجمهور في المستقبل.
يجعل الذكاء الاصطناعي الإبداع في متناول الجميع ، وتساعده الموسيقى في التطور. لفهم كيفية تقارب هذين القطبين والتأثير على بعضهما البعض ، يمكنك "أرقام الدرس"من Yandex -" الفن الرقمي: الموسيقى وتكنولوجيا المعلومات ". جنبًا إلى جنب مع أبطال الرسوم الهزلية ، سيتعلم المشاركون كيف تتعرف الشبكات العصبية على المسارات وتولدها وما هي التقنيات التي تساعد في عمل خدمات الموسيقى التي نعرفها. في الدرس ، سيحاول الطلاب تخمين اللحن من خلال المخطط الطيفي بأنفسهم وتجميع قائمة تشغيل مع التوصيات.
أريد "أرقام الدروس"
التغطية: ويليام برادبيري / شاترستوك / إريك إيسيلي / شاترستوك / لجوبكو سموكوفسكي / شاترستوك / فوتوسبلاش / شاترستوك / أولغا سيليبينا / لايفهاكر