Secondo lo sviluppatore Stable Diffusion nella nuova versione XL 9.0 in arrivo è in grado di generare immagini iper realistiche con dettagli e qualità idonei per l’impiego in TV, musica, film, video istruzioni, oltre che in campo industriale e nel design.
Si tratta uno dei primi e più famosi modelli AI specializzato nella generazione di immagini a partire da una descrizione testuale. Nel corso del tempo e con la versione XL oltre ai prompt testuali ricordiamo che è anche possibile partire da una immagine che poi la AI generativa andrà a modificare per ottenere variazioni di quella di partenza.
Stable Diffusion XL è anche in grado di ricostruire parti mancanti all’interno di una immagine (inpainting), oltre che generare una estensione di una immagine esistente (outpainting).
La società Stability AI dimostra il notevole balzo nella qualità delle immagini e dei dettagli generati a partire da prompt identici: a sinistra è mostrata l’immagine generata dal modello AI attuale, mentre a destra quella ottenuta con la nuova versione XL 0.9 disponibile da lunedì 26 giugno.
Sia per le immagini di fantasia come quella degli alieni che vivono tra noi ripresi a Las Vegas negli anni ’50, così come l’immagine del lupo nella foresta, infine il caffè americano da asporto sulla spiaggia all’alba: il balzo nei dettagli e nel realismo è evidente e notevole.
Cosa cambia sotto il cofano
I notevoli miglioramenti nella composizione delle immagini sono dovuti a un grande balzo nei parametri gestiti dal modello. La versione beta attuale funzione con 3,1 miliardi di parametri e un solo modello. La nuova versione 0.9 di Stable Diffusion XL impiega due modelli, quello base con 3,5 miliardi di parametri, affiancato da un secondo modello da 6,6 miliardi di parametri.
Nella prima fase in modello AI genera l’immagine, mentre nella seconda fase il secondo modello viene impiegato per aggiungere più dettagli. Lo sviluppatori dichiara che si tratta di uno dei modelli AI open source per generare immagini con più parametri in circolazione.
Funziona sul computer di casa
Nonostante il balzo nella qualità del risultati, SDXL 0.9 è in grado di funzionare anche su un recente computer dotato di GPU. Le specifiche indicano Nvidia GeForce RTX 20, equivalente o superiore, Windows 10 o 11, Linux e 16 GB di RAM. Tutte le immagini di questo articolo sono di Stability AI.
Lo sviluppatore non accenna alla versione Mac, ma i lavori per l’accelerazione sui processori Apple sono in corso fin da dicembre 2022 e macOS Sonoma integra ottimizzazioni ad hoc per AI.