I ricercatori Apple hanno rilasciato un nuovo modello di intelligenza artificiale AI open-source in grado di modificare immagini basandosi sulle istruzioni dettate dall’utente con linguaggio naturale. Chiamato MGIE, acronimo di MLLM-Guided Image Editing, utilizza modelli di linguaggio multimodali (MLLM) per interpretare le richieste dell’utente ed eseguire manipolazioni a livello di pixel.
Il modello AI di Apple è in grado di modificare vari aspetti delle immagini e applicare migliorie globali, in particolare alla luminosità, al contrasto o nitidezza, oppure applicare effetti artistici.
Il nuovo strumento è anche in grado di applicare modifiche a determinate porzioni della foto, alterandone la forma, la dimensione, il colore o la texture di regioni o oggetti specifici in un’immagine, mentre le modifiche in stile Photoshop possono includere ritagli, ridimensionamenti, rotazioni, oltre all’aggiunta di filtri, o addirittura le modifiche di sfondi e fusione di immagini.
Esempi pratici
Lo strumento potrebbe essere utilizzato, come sottolinea macrumors, per trasformare la foto di una pizza, scrivendo semplicemente “rendila più salutare”. Utilizzando il ragionamento del buon senso, il modello può aggiungere condimenti vegetali, come pomodori ed erbe aromatiche.
Una richiesta di ottimizzazione generale potrebbe assumere la forma di “aggiungi contrasto per simulare più luce”, mentre una modifica in stile Photoshop potrebbe consistere nel chiedere al modello di rimuovere persone dallo sfondo di una foto, spostando così l’attenzione sull’espressione facciale del soggetto.Il modello è disponibile su GitHub e include il codice, i dati e i modelli pre-addestrati.
Oltre le immagini, Apple avanza in campo AI
Questo è il secondo risultato importante di Apple nella ricerca AI negli ultimi mesi. Alla fine di dicembre Apple ha rivelato di aver compiuto progressi nella distribuzione di modelli di linguaggio di grandi dimensioni (LLM) su iPhone e altri dispositivi mobile con memoria limitata, inventando una promettente tecnica di utilizzo della memoria flash.
Negli ultimi mesi, si ritiene che Apple abbia testato un concorrente di ChatGPT, una sorta di Apple GPT che potrebbe competere con gli attuali chatbot. Secondo Mark Gurman di Bloomberg, il lavoro in campo AI è una priorità per Apple, con l’azienda che sta progettando un framework chiamato “Ajax” per modelli di linguaggio estesi.
Sia The Information che l’analista Jeff Pu sostengono che Apple avrà funzionalità generative basata su AI disponibile su iPhone e iPad intorno alla fine del 2024, quando verrà rilasciato iOS 18.
Si pensa che iOS 18 includa una versione migliorata di Siri con funzionalità di Intelligenza Artificiale generativa simile a ChatGPT. Per questo, iOS 18 potrebbe essere l’aggiornamento software “più grande” nella storia di ‘iPhone.
Anche Tim Cook ha anticipato novità Apple in campo AI in arrivo entro quest’anno. Tutte le notizie che parlano di Intelligenza Artificiale sono disponibili a partire da questa pagina di macitynet.