تقوم الشبكة العصبية الصوتية الثابتة الجديدة بإنشاء الموسيقى بناءً على وصف النص
Miscellanea / / September 14, 2023
من المبدعين في Stable Diffusion.
استقرار الذكاء الاصطناعي، المعروف بشكل أساسي بالشبكات العصبية لتوليد الصور (انتشار مستقر, رسومات الشعار المبتكرة المستقرة وليس فقط)، مطلق سراحه شبكة عصبية جديدة صوت مستقر. كما يوحي الاسم، فإنه يولد مقاطع صوتية.
كل شيء يعمل بنفس طريقة عمل مولدات الصور بناءً على أوصاف النص. يحدد المستخدم الكلمات الرئيسية (على سبيل المثال، "melodic lo-fi hip-hop، melodic، 85 BPM" أو "معدن الموت مع مقطوعات جيتار قوية وطبول سريعة")، بالمدة المطلوبة وانتظر النتيجة.
استخدمنا نفس النموذج الموجود في Stable Diffusion كأساس، ولكننا قمنا بتدريبه على المقطوعات الموسيقية بدلاً من الصور. في المجمل، تم تغذيتها بحوالي 800 ألف مقطوعة موسيقية من موقع الموسيقى AudioSparx - أو حوالي 19500 ساعة من الأصوات المختلفة.
لاحظ المبدعون أن الميزة الرئيسية لـ Stable Audio هي القدرة على إنشاء مقطوعات موسيقية بطول معين. في السابق، كانت الشبكات العصبية تعمل فقط لمدة محددة: إذا تم تدريبها على مقاطع صوتية مدتها 30 ثانية، فيمكنها إنشاء مقطوعات موسيقية مدتها 30 ثانية فقط. لتتمكن من ضبط مدة المسار، كان على المطورين تغيير النموذج وإضافة البيانات الوصفية لبداية ونهاية المقطوعة.
يتم تقديم الصوت الثابت في ثلاثة نماذج. يتيح لك الإصدار المجاني إنشاء ما لا يزيد عن 20 أغنية تدوم حتى 45 ثانية شهريًا. هناك أيضًا اشتراك احترافي يتيح لك إنشاء ما يصل إلى 500 مسارًا يصل طولها إلى 90 ثانية مقابل 12 دولارًا لكل مقطع شهر (≈1200 روبل) وخيار المؤسسة للشركات التي لديها القدرة على تحديد حجم التوليد والسعر بشكل فردي نعم. لا يمكنك استخدام الموسيقى التي تم إنشاؤها لأغراض تجارية دون اشتراك مدفوع.
كما هو الحال مع الشبكات العصبية المماثلة الأخرى، تستهدف تقنية Stable Audio منشئي المحتوى أكثر من الموسيقيين المحترفين. تعتبر هذه الأدوات مناسبة لإنشاء موسيقى خلفية للبودكاست ومقاطع الفيديو بسرعة عندما لا يكون لديك الوقت أو الميزانية للتعاون مع الملحن. ويمكنه أيضًا استبدال أصوات المخزون إذا كنت تريد ضحكًا فريدًا أو ضجيجًا جماعيًا.
يمكنك تجربة Stable Audio على الموقع الرسمي. ستحتاج إلى التسجيل أو تسجيل الدخول باستخدام حساب Google. في البداية، قد يكون هناك انقطاع في الوصول بسبب الحمل الثقيل على الخادم.
صوت مستقر →
المزيد من الشبكات العصبية الجديدة🦾✨
- سيقوم المساعد الافتراضي AIDA من Sber بتشخيص المرضى في عيادات موسكو
- يقوم التطبيق الجديد Artisse بإنشاء صور رائعة بوجه المستخدم
- قدم Stability AI برنامج chatbot Stable Chat - وهو نظير مجاني لـ ChatGPT