Presto chiunque potrà creare una base musicale, anche senza saperne un’acca di musica: la promessa arriva dal nuovo kit AI di Meta, che è in grado di generare suoni e musica partendo da una semplice descrizione testuale.
Mentre immagini e testi sono già diventati ampiamente popolari, nel nuovo mondo dell’intelligenza artificiale generativa i suoni sono rimasti particolarmente indietro. Non che non ci siano progetti (basti pensare al MusicLM di Google), ma la maggior parte risultano complicati e spesso chiusi. Così Meta ha ben pensato di velocizzarne lo sviluppo proponendo una sua soluzione del tutto open-source.
Si chiama AudioCraft ed è un kit che include diversi modelli di AI generativa per l’audio: c’è ad esempio AudioGen che permette di creare effetti sonori, mentre col MusicGen si può creare vera e propria musica; con EnCodec invece si possono comprimere i suoni senza comprometterne la qualità finale.
Qualche esempio
Ce ne da un assaggio Meta attraverso una breve clip pubblicata sul suo sito web: basta dire all’AI di creare un sottofondo in stile “scena di un film in un deserto con le percussioni” o una base “strumentale jazz, con un tempo medio e un pianoforte vivace” per ottenere esattamente quel che gli si è chiesto.
Allo stato attuale è già capace di esaudire richieste anche più mirate come il montare un pezzo di musica “elettronica anni ’80 con ritmi di batteria“, un “dj set reggae stile giamaicano elettronico” o un “morbido hip-hop, con bassi profondi e la presenza di scratching su un vinile“.
Come funziona
Il pacchetto comprende diversi modelli pre-addestrati con materiale pubblico o di Meta che permettono di arrivare più facilmente ai risultati desiderati, ma gli esperti hanno comunque l’accesso completo all’intero codice in modo da poter perfezionare il tutto secondo le loro capacità. Chi vuole può persino addestrare i modelli con i propri dati, in modo da ottenere risultati diversi e più complessi.
Per il momento questo kit non è per tutti, ma è pensato per lo più per i ricercatori; si sta comunque lavorando per migliorare soprattutto le prestazioni e i sistemi di controllo in modo da aumentarne le potenzialità.
A cosa serve il kit AI di Meta per la musica
L’obiettivo finale comunque è arrivare a poter creare basi musicali, campioni e altro senza bisogno di saper suonare uno strumento o conoscere la teoria musicale. Così davvero chiunque potrà realizzare un sottofondo audio per questo o quel video, sia che si tratti di uno spot pubblicitario per la propria azienda da pubblicare sui social, sia che si voglia dare del movimento a una serie di foto di famiglia montate in una clip.
Ma potrebbe essere usato anche dai musicisti professionisti che vogliono provare nuove composizioni anche al di fuori del proprio studio di registrazione e senza strumenti musicali a portata di mano: gli basterà prendere in mano lo smartphone.
Meta sta lavorando anche a chatbot AI con diverse personalità, incluso Abraham Lincoln, destinati a compiti specifici per attrarre e fidelizzare gli utenti. Tutto sull’intelligenza artificiale in questa sezione del nostro sito.