vero o falso? Affidarsi alle immagini su Internet è sempre più rischioso, poiché le immagini generate dall’intelligenza artificiale (AI) si moltiplicano. Mentre alcuni elementi visivi sono deliberatamente artistici e onirici, traendo ispirazione dal mondo della fantascienza, dai manga giapponesi o persino dalla pittura impressionista, altri sono inquietantemente realistici.
Come molte celebrità mondiali, l’immagine di Papa Francesco è stata oggetto di innumerevoli sequestri nelle ultime settimane: Twitter lo ha raffigurato in piumino bianco, ma anche con le braccia ricoperte di tatuaggi o addirittura come dj in una discoteca. Queste foto false sono state realizzate utilizzando Midjourney, un programma uscito a luglio 2022 ed è già alla sua quinta versione.
La mia versione di AI Papa Francesco… in questa scena si fa un tatuaggio. prompt nel testo alternativo #Possiede# arte# un lavoro# Comunità# A metà viaggio#ritwitta#ritwitta#ritwitta# Oh Signorepic.twitter.com/LRa3qEb5BD
– Cesar Gamez (@cesar20984) 4 aprile 2023
Un fenomeno fiorente negli ultimi cinque anni
I deepfake (o “hyperfake”) non sono una novità, però: la loro rinascita risale al 2018. Quell’anno ricordiamo il flemmatico Barack Obama che insultava Donald Trump davanti alla telecamera, la bandiera americana sullo sfondo. Tre anni dopo, Emmanuel Macron annuncia ai francesi che un attacco nucleare è imminente, prima che una finta Brigitte si unisca a lui per un abbraccio.
Queste manipolazioni di immagini e video sono apparse per la prima volta nell’industria della pornografia, prima di guadagnare terreno nell’intrattenimento, nella politica e persino nell’arte. Nel 2018, un dipinto “Dipinto” da algoritmi è stato venduto all’asta per $ 350.000 a New York. La tecnologia era ancora lontana dall’essere matura all’epoca e il risultato fu molto meno impressionante di quanto lo sia oggi, come si può giudicare dall’offuscamento del volto fotografato.
RT @dipendente: Il dipinto “Dipinto” dall’intelligenza artificiale sarà presto (23-25 ottobre) venduto all’asta da Christie’s! https://t.co/B4sedhxaGp#ai#intelligenza artificiale#arte attraverso @dipendente sperone @dipendentepic.twitter.com/rZBsY66a9w
– Alex A (ChangeonsLeJeu) 29 agosto 2018
Gli strumenti sono ora disponibili al pubblico in generale
In cinque anni la situazione è cambiata. Innanzitutto per quanto riguarda la tecnologia utilizzata. Fino al 2022, la generazione di immagini si basava su una classe di algoritmi chiamati GAN (“generative adversarial networks”), scoperta nel 2014. Questo tipo di algoritmo di apprendimento non supervisionato si allena da un numero molto elevato di grafici annotati per produrre immagini inedite per un genere specifico e sempre più realistico.
L’anno 2022 ha visto la nascita di nuovi strumenti, più efficienti, più accurati e più generali, basati sui cosiddetti algoritmi di “diffusione”. L’immagine viene “allucinata” dall’IA mediante una graduale “riduzione del rumore”, consentendo di disporre il risultato, pixel per pixel, per rispondere alle istruzioni impartite.
Una volta ottenuta la prima rappresentazione, l’utente può richiedere modifiche e quanto più dettagliata è la sua descrizione, tanto più fedele sarà l’immagine prodotta alle sue aspettative. E così l’autrice di fumetti Joanne Sfar ha potuto ricostruire un ritratto — molto simile — della madre defunta, semplicemente descrivendone il volto a Midjourney.
Anche se non tutti abbiamo la capacità di descrivere accuratamente un profilo o un paesaggio, non abbiamo più bisogno di essere esperti di computer per creare da zero immagini ad alta risoluzione. Anche l’immaginazione è illimitata ed è possibile imbattersi in varianti sorprendenti a volte: una giraffa che salta su una corda su un lastrone di ghiaccio, per esempio.
Prima di Midjourney, il primo gadget di questo tipo sviluppato era chiamato Dall-E (una contrazione di “Salvador Dali” e il robot del film d’animazione “Wall-E”). È stato svelato nel gennaio 2021 dalla startup americana OpenAI, che nel novembre 2022 ha lanciato il popolare programma di chat virtuale ChatGPT.
Sulla scia di Dall-E, sono emerse molte soluzioni gratuite e open source. I principali sono dunque MidJourney, che oggi è il riferimento, ma anche Craiyon, che propone ogni volta un mosaico di nove immagini, o Stable Diffusion, programma britannico con 10 milioni di utenti giornalieri.
Hanno tutti versioni gratuite, ma il rilascio di Midjourney è stato sospeso il 30 marzo a causa di un’esplosione di netizen, che il CEO David Holz ha ritenuto eccessivo. Un abbonamento mensile ora costa tra $ 10 e $ 60.
Come si riconosce l’immagine generata dall’intelligenza artificiale?
Queste tecnologie stanno migliorando di giorno in giorno, ma alcune anomalie possono ancora essere rilevate dalle immagini elaborate. Le mani, in particolare, sono la parte del corpo più difficile da rappresentare con un’intelligenza artificiale a causa del loro aspetto altamente strutturato. Le immagini generate automaticamente a volte hanno nocche storte o dita sproporzionate, come in questo falso scatto che rivisita l’anello di schiaffo che Will Smith ha regalato a Chris Rock durante gli Oscar nel 2022.
Will Smith che mangia la paella 305
Twitto un personaggio a caso che mangia paella tutti i giorni. Indovina chi sarà il prossimo.# A metà viaggio#FreewayML# Diffusione stabile# cabina dei sogni#WOMBO#lastra#dora#matita#Possiede# Qualunque# un lavoropic.twitter.com/jM3eTUItqW
– La generazione AI mangia la paella (dalleeatspaella) 12 aprile 2023
Anche i dettagli sullo sfondo possono mancare di sottigliezza o coerenza: finestre inclinate, un muro storto, ecc. Infine, la pelle umana raramente ha una “grana” dell’immagine intatta e spesso ricorda ancora la pelle di silicone degli eroi dei videogiochi.