غوغل تطلق أداة ذكاء اصطناعي تحول النصوص إلى موسيقى
أعلنت شركة جوجل عن ابتكارها الجديد في مجال الذكاء الاصطناعي، وهو أداء توليد الموسيقى، الذي يمكنه تحويل النص القصير إلى أغنية أو مقطوعة موسيقية. ومع ذلك، تواجه هذه التقنية مخاوف قانونية قد تمنعها من الاستخدام العام.
في العام 2022، شهدت التكنولوجيا الحديثة ثورة في مجال الذكاء الاصطناعي، حيث تم إطلاق ChatGPT و DALL-E 2 من قبل شركة OpenAI، بالإضافة إلى أنظمة أخرى تستخدم الذكاء الاصطناعي لخلق الصور والنصوص والموسيقى حسب رغبة المستخدمين.
وقد تم تدريب أنظمة الذكاء الاصطناعي لإنشاء الموسيقى بتناسب النصوص والصوتيات والصور، بما في ذلك أداة Jukebox التي تم إطلاقها عام 2020 من قبل شركة OpenAI.
- ولكن، لم يتم استقبال هذه التقنيات الموسيقية بنفس الحماس الذي استقبلت به التقنيات النصية والصورية، وذلك بسبب أن نتائجها لا تحمل جودة عالية ودقة، وغالبًا ما تفتقر إلى هيكلية الأغنية الأساسية.
- ومع ذلك، هناك تحسينات كثيرة حدثت في هذه التقنيات، ومن بينها أداة MusicLM من جوجل التي تستخدم الذكاء الاصطناعي لإنشاء مقاطع صوتية تدوم خمس دقائق بتناسب النص المدخل.
- وعلى الرغم من أن هذه المقاطع الصوتية ليست عالية الجودة، إلا أنها تشبه إلى حد كبير الأغاني البشرية بشكل أفضل مما يفعله أي نظام آخر من أنظمة الذكاء الاصطناعي المنشأة.
قامت جوجل باستخدام أكثر من 280,000 ساعة من التسجيلات الموسيقية لتدريب أداة MusicLM باستخدام نموذج MuLan المدرب على ربط الموسيقى بالأوصاف المكتوبة بلغة طبيعية. أنشأت الشركة بعد ذلك MusicCaps وهي قاعدة بيانات تحتوي على أكثر من 5500 تسجيل موسيقي يمكن الوصول إليها لتقييم مستوى المقاطع الموسيقية التي ينتجها الذكاء الاصطناعي.
- وبعد ذلك قارنت جوجل أداة MusicLM باثنين من أنظمة الذكاء الاصطناعي الأخرى Mubert و Riffusion، باستخدام مقاييس كمية لتقييم جودة الصوت والتزامه بالنص.
- وأظهرت النتائج تفوق أداة MusicLM على الأنظمة الأخرى في جميع المجالات.
- ومع ذلك، تعاني الأداة من مشكلات في محاكاة هيكل الأغاني التقليدية وجودة الموسيقى التي تنتجها، وهذا يمنع إطلاقها للجمهور بسبب المشكلات القانونية المتعلقة بنسبة التطابق. ويعمل باحثو جوجل على تحسين هذه المشكلات في المستقبل.
الاداة لم تطلق للعامة .
التعليقات على الموضوع