Esistono già diverse IA in grado di trasformare testi e immagini in video in base alle indicazioni dell’utente e in un brevetto di Microsoft ora si fa riferimento anche all’audio come possibile sorgente di input.
A riferirlo è il sito MSPowerUser che ha scovato un brevetto nel Patent and Trademark Office (USPTO) statunitense nel quale Microsoft fa riferimento a un sistema AI in grado di convertire audio un tempo reale (dal vivo) in immagini.
Il sistema prevede la cattura dell’audio live, ad esempio uno speaker in una conferenza o il parlato durante una lezione, trascrivendo automaticamente il testo. La trascrizione può essere analizzata da un large language model (LLM), data “in pasto” a un generatore in grado di creare immagini partendo da prompt di testo e generare output sullo schermo.
Il sistema può continuare a generare immagini durante il flusso audio e generare ininterrottamente immagini dal vivo fino a quando non si ferma lo stream. Secondo Microsoft, le immagini visualizzate in tempo reale potrebbero essere utili per rendere più efficaci le comunicazioni, con l’ausilio di immagini utili per coinvolgere maggiormente le persone.
“La visualizzazione di immagini relative a informazioni comunicate verbalmente può migliorare l’efficacia della comunicazione, rendendola più coinvolgente, memorabile e facile da comprendere”, spiega Microsoft.
Come sempre quando parliamo di brevetti, ricordiamo che non è detto che questo si trasformerà in un prodotto/servizio reale: molti brevetti rimangono idee su carta in attesa di ulteriori sviluppi o studi per capire l’effettiva vendibilità. Se Microsoft dovesse decidere di proporre un simile sistema, è probabile che si tratterà di qualche futura funzionalità legata a Microsoft Teams, piattaforma di comunicazione e collaborazione unificata che combina chat di lavoro persistente, teleconferenza, condivisione di contenuti (incluso lo scambio e il lavoro simultaneo sui file) e integrazione delle applicazioni.
Tutte le notizie che parlano di Intelligenza Artificiale sono disponibili a partire da questa pagina di macitynet.