Negli ultimi giorni, OpenAI ha annunciato un aggiornamento particolarmente significativo per ChatGPT, che introduce nuove capacità visive nel modello GPT-4o – Il modello è ora in grado di generare immagini direttamente, senza appoggiarsi a DALL·E come in passato. Un cambiamento che apre la strada a risultati molto più fluidi, precisi e naturali.
Gli aspetti che fino a poco tempo fa mettevano in difficoltà qualsiasi intelligenza artificiale – come la rappresentazione delle mani, la scrittura leggibile all’interno delle immagini o l’equilibrio tra coerenza e creatività – oggi vengono gestiti con più naturalezza.
Il nuovo modello non solo migliora la qualità visiva, ma lo fa con uno stile riconoscibile, capace di spaziare da scene realistiche a interpretazioni artistiche, come dimostra il trend virale delle immagini in stile Studio Ghibli che ha invaso i social.
Sam Altman, CEO di OpenAI, ha dichiarato che la generazione di immagini nativa è già attiva in GPT 4o per account Plus, Pro, Team e Gratuiti, seppur con qualche limitazione per questi ultimi per fronteggiare l’elevata richiesta che, a detta del CEO, sta facendo fondendere le GPU.
OpenAI ha dichiarato che il modello GPT-4o è stato addestrato con dati disponibili pubblicamente, avvalendosi anche di partnership con aziende come Shutterstock.

GPT-4o – Come migliora il modello per la generazione di immagini?
Con questo nuovo aggiornamento, cadono tantissimi limiti legati all’utilizzo del potente modello AI. Primo tra tutti, come abbiamo già visto, la generazione di testi, ormai quasi impeccabile (basta notare, nell’immagine soprastante, come il modello abbia sostituito la parola “Progetto” con “Drogetto”, a riprova del fatto che potrebbe ancora presentare qualche piccola imperfezione).
Un enorme passo avanti è stato fatto anche nella rappresentazione delle mani e di altre parti del corpo, che fino a poche settimane fa venivano spesso generate con evidenti imperfezioni.
Ma l’aspetto forse più sorprendente è la versatilità stilistica: adesso è possibile generare immagini di altissima qualità in una vasta gamma di stili: dal fotorealismo al cartoon, passando per il 3D in pieno stile Pixar — il tutto senza bisogno di prompt complessi, prendendo come riferimento anche immagini da voi caricate e aggiungendo dettagli (richiesti via prompt) per ottenere un risultato del tutto nuovo.


Le immagini in stile “Studio Ghibli” che dominano i social
Nelle ultime ore vi sarà sicuramente capitato di vedere i social invasi da immagini che raffigurano situazioni reali raffigurate come se fossero tratte da un prodotto Studio Ghibli.
Questo fenomeno, come abbiamo già spiegato, è reso possibile da ChatGPT che, con il modello GPT-4o, basta caricare una qualsiasi immagine e chiedere, ad esempio, di “Convertirla in un cartone Studio Ghibli” per ottenere un risultato che lascia a bocca aperta, conservando tutti gli aspetti distintivi dell’immagine originale.
Sul web girano anche molti meme riadattati in questo stile il quale, dal momento che è finito praticamente nelle mani di chiunque, sta suscitando critiche, polemiche e stupore generale tirando in ballo la questione “copyright” sulla quale si tornerà nei prossimi giorni…





Tuttavia, è possibile generare immagini appartenenti a più stili artistici. Nel nostro caso, possiamo vedere come questa foto (Scattata durante la nostra esperienza al MWC Barcelona), sia stata trasformata in un cartoon in 3D nel giro di 2-3 minuti, mantenendo tutti i tratti distintivi dell’immagine originale:

Insomma, si tratta di un aggiornamento di GPT-4o che arriva come un fulmine a ciel sereno e che farà molto parlare di sé nel bene e nel male.
Una cosa è certa: l’industria dell’arte digitale sta venendo scossa da questi nuovi modelli di AI Generativa. Resta da capire se, nell’immediato futuro, chiunque potrà usufruirne a discapito di animatori, illustratori e registi oppure se diventeranno il loro braccio destro…
Nel video di presentazione di OpenAI, possiamo vedere come ChatGPT riesce a convertire uno schizzo in un fumetto vero e proprio, oltre a tutte le enormi potenzialità del nuovo modello.
Nel frattempo, potete dare un’occhiata al nostro video in cui proviamo il modello di Sora, anch’esso interessato da questo aggiornamento.
Che fine farà DALL·E?
OpenAI ha dichiarato che, almeno al momento, manterrà DALL·E come GPT sé stante per gli utenti che preferiscono usufruire esclusivamente delle sue capacità. Ciò fa sì che gli utenti possano avere accesso completo al vecchio modello di generazione di immagini che, fino ad ora, ha accompagnato ChatGPT. Permettendo al contempo di avere accesso a tutte le funzionalità avanzate offerte da GPT-4o.