OpenAI sta per lanciare la terza versione di DALL-E, il suo sistema di intelligenza artificiale capace di generare un’immagine partendo da una richiesta testuale, che adesso si integra perfettamente con ChatGPT in modo da interpretare al meglio le descrizioni fornite dagli utenti, arricchendole con dettagli.
Questa piattaforma è stata rilasciata per la prima volta al pubblico nel gennaio 2021, ben prima di Midjourney e altri sistemi di questo tipo. Già all’epoca era in grado di “disegnare” delle immagini partendo dalle descrizioni testuali digitate dagli utenti, ma nel tempo il suo accesso è stato limitato e controllato con maggiore severità per evitare che potesse essere usata per generare immagini fotorealistiche o che mostrassero esplicitamente scene di odio o violente.
Cosa cambia con DALL-E 3 con ChatGPT integrato
Questa ultima versione, la numero 3, è stata enormemente potenziata attraverso l’integrazione di ChatGPT, il chatbot di intelligenza artificiale il cui interesse mediatico è esploso proprio in questo ultimo anno. L’unione di queste due potenze – spiegano – porta miglioramenti significativi nella realizzazione di ciò che viene effettivamente chiesto dagli utenti.
DALL-E offre risultati migliori quando il prompt, la descrizione testuale inserita dall’utente per generare l’immagine, è particolarmente lunga e dettagliata. Sicché nel momento in cui l’utente non riesce ad articolare bene ciò che desidera, entra in gioco ChatGPT che genera un prompt quanto più completo e dettagliato possibile
In una delle dimostrazioni condotte da Aditya Ramesh, ricercatore a capo del team di DALL-E, ha chiesto a ChatGPT di aiutarlo a creare un logo per un ristorante di ramen in montagna.
L’integrazione tra le due piattaforme di OpenAI ha permesso prima a ChatGPT di generare un prompt testuale più lungo e dettagliato, dopo di che il prompt è stato dato in pasto a DALL-E versione 3 che ha generato quattro diverse immagini.
Un altro miglioramento di DALL-E riguarda la raffigurazione più precisa e minuziosa di elementi che con le precedenti versioni apparivano piuttosto imprecisi, come ad esempio la raffigurazione di mani e testi all’interno delle immagini. E secondo quanto annunciato, adesso è meglio addestrato a ignorare determinate parole nelle descrizioni che potrebbero portare alla generazione di immagini esplicite o di odio.
Disponibilità
Per il momento DALL-E 3 sarà accessibile soltanto agli utenti con abbonamento ChatGPT Plus o Enterprise a partire da ottobre, mentre nel tardo autunno dovrebbe arrivare una sua versione gratuita per tutti gli altri.