Meta lance Audiocraft, un générateur de musique AI open source

Le nouveau générateur de musique AI de Meta est le dernier d'une série de produits AI récemment publiés par la société technologique.

Mercredi, Meta a annoncé la sortie d'Audiocraft, une IA générative open source qui crée l'audio et la musique à partir d'invites de texte. Audiocraft a trois modèles, Musicgen pour la composition de la musique, l'audiogène pour créer des effets sonores et Encodec, qui utilise l'IA pour aider à la compression audio qui surpasse le format MP3.

Au cas où vous vous interrogériez sur les problèmes de droit d'auteur, Musicgen a été formé sur de la musique méta-propriété et sous licence.

Meta a poussé agressivement à apporter des outils alimentés par l'IA aux masses en concurrence avec Openai, Google et Microsoft. En juillet, il a publié son Open-source Llama 2, la dernière version de son LLM (grand modèle de langue.)

Contrairement au GPT-4 d'OpenAI et à Palm 2 de Google, Llama 2 est Open-source, qui gagne des méta points parmi les développeurs et les éthiciens qui croient à la transparence du développement de l'IA. Il y a aussi des rumeurs sur le lancement de Meta lancement des "personnages" AI aka chatbots pour Instagram, Facebook et WhatsApp.

Audiocraft a été conçu avec des musiciens et des concepteurs sonores à "fournir l'inspiration, aider les gens à réfléchir rapidement et à itérer leurs compositions de nouvelles façons", a indiqué l'annonce.

Les exemples de l'article de blog incluent des échantillons audio de l'invite "Whistling with Wind Blowing" et "Pop Dance Track avec des mélodies accrocheuses, des percussions tropicales et des rythmes optimistes, parfaits pour la plage", qui ... ressemblent avec succès à ces descriptions.

Une grande partie des développements génératifs d'IA récents se sont concentrés sur la génération de texte et d'image, ce qui est un processus plus simple.

Le texte à audio est une entreprise plus compliquée que Meta semble avoir craqué. Audiocraft apprend les jetons audio à partir de signaux bruts utilisant son codec audio de l'encodale neuronal propriétaire pour créer un nouveau "vocabulaire" pour le modèle.

Il forme ensuite des modèles de langage sur ce vocabulaire audio afin que le modèle comprenne les associations entre l'audio et le texte. Étant donné qu'Audiocraft est également open-source, le code est disponible sur GitHub pour que les utilisateurs puissent explorer et tester pour eux-mêmes.

pour-batterie

携帯電話、パソコン、タブレット、時計、アダプターなどのデジタル製品用バッテリーを含む、フランスの有名なバッテリーサイトです。

0コメント

  • 1000 / 1000