L'Officiel Art

Silicon Dream: l'algoritmo di Elon Musk che crea le immagini

Nato dall'ingegno degli imprenditori tech Elon Musk, Greg Brockman, Ilya Sutskever, Wojciech Zaremba e John Schulman, DALL-E è un algoritmo di realtà aumentata capace di generare immagini a partire da descrizioni testuali. 

Sara Hoover, "Luscious Mermaid Birth Party During the Flemish Renaissance with Pre-Raphaelite Hair, shot by Tim Walker"
Sara Hoover, "Luscious Mermaid Birth Party During the Flemish Renaissance with Pre-Raphaelite Hair, shot by Tim Walker"

Il tracollo della storia dell'arte potrebbe essere iniziato con una scollatura - nello specifico quella di Jennifer Lopez con l'abito di Versace indossato ai 42esimi Grammy Awards il 23 febbraio del 2000. Impazienti di dare un'occhiata, orde di fan avevano cercato su Google "J.Lo Grammy Dress", ma non avevano trovato nulla perché la ricerca per immagini doveva ancora essere inventata. Il gran numero di ricerche per quel vestito ha ispirato Google a creare Google Images, che sono riusciti a realizzare nel luglio 2001. Ventuno anni dopo, il concetto pionieristico di photo ricercabili e pubblicamente disponibili ha ammassato più di 1.12 bilioni di immagini per Internet. Nell'ampiezza di dati che abbiamo caricato, condiviso, creato e dimenticato, abbiamo creato una nuova formula per l'accumulo dell'immagine e, senza saperlo, abbiamo sviluppato un vasto bacino di dati per il traning dei ricercatori dell'AI - intelligenza artificiale - e degli algoritmi da usare. Ci sono voluti anni per arrivare all'attuale potenza di elaborazione dei generatori text-to-image. Per la maggior parte, il lavoro di labeling delle immagini è stato il contributo più significativo, che ha richiesto un eccezionale quantità di ore di lavoro da parte dell'uomo. Nel 2007, gli scienziati di computeristica a Stanford e a Princeton hanno iniziato a classificare immagini deragliate dalle label veloci che gli utenti generici avevano semplicemente attribuito alle loro foto del tipo "gatto jpeg". Hanno realizzato la necessità di un input generato dall'uomo per creare dei titoli sofisticati delle immagini per i programmi di classificazione in grado di ottimizzare la capacità di ricerca. (Li sta la differenza tra "gatto" e "grosso soffice gatto bianco in una cesta"). Il progetto ha occupato più di 20mila persone che hanno etichettato delle immagini; nel 2012, il team aveva creato un database di 14 milioni di foto titolate. E una volta soddisfatti con gli sviluppi del lavoro, gli scienziati hanno appeso un poster che pubblicizzava la raccolta di dati in un centro conferenze di Miami Beach, che rapidamente è evoluto in una competizione annuale per vedere quali algoritmi potessero identificare oggetti nelle immagini delle raccolte dati con il minor tasso di errore.

Scorri verso il basso per scoprire di più sull' algoritmo DALL-E di realtà aumentata

"Tech CEOs imposing their will unto te art world in the style of Cindy Sherman" BY ALEXIS SCHWARZ
"Tech CEOs imposing their will unto te art world in the style of Cindy Sherman" BY ALEXIS SCHWARZ

È iniziata così la genesi di una rete generativa avversaria, nota come GAN - Generative Adversarial Network. GAN è cominciato come una battaglia tra geek. Come spiega Loz Blain, scrittore di tecnologia, i GAN mettevano: «Due intelligenze artificiali in competizione l'una con l'altra, entrambe "allenate" perché erano state mostrate enormi quantità di immagini reali, titolate per aiutare gli algoritmi a imparare che cosa dovevano cercare. Un "generatore AI a quel punto inizia a creare immagini e un "discriminatore" Al cerca di indovinare se sono immagini vere o delle creazioni di AI». Dopo miliardi di iterazioni, l'AI è diventata più sofisticata nel creare e decifrare, però è rimasta rudimentale nei suoi ragionamenti concettuali immaginativi. A volte, l'AI era convinta della realtà di foto che dei bambini avrebbero considerato irrealistiche. Nel 2016, Andrew Conru, un uomo d'affari con un Ph.D in ingegneria meccanica all'Università di Standford che aveva contribuito a sviluppare degli allora pionieristi shopping cart e dei servizi online di matchmaking, ha fatto fare ai GAN un'ulteriore passo. Per Conru, «Il logico next step nel percorso dell'evoluzione artistica» era quello di appaltare la fabbricazione a ingegneri che, con una vasta comprensionedell'hardware e del software, potessero rendere i pittori obsoleti. Da li è stata fondata la RobotArt. La competizione, animata dallo Smithsonian e da Popular Mechanics, si è tradotta in un "nerdgasmo" distopico di entusiasti della robotica che ricreavano superficialmente dipinti senza la mano umana. Alcuni robot hanno creato "nuove opere", altri hanno replicato la Pop art, mentre altri sono stati codificati per creare stilisticamente "nuove" versioni dell'impasto di Van Gogh attraverso dei generatori AI. Alla fine, i vincitori si sono divisi un premio da 100mila dollari, hanno rimpacchettato i propri robot e se ne sono tornati a casa, per nulla turbati dallo schiaffo metaforico. Poi però è arrivato il GANismo. Perché gli artisti emergono allinterno di uno spazio per liberare il mezzo dalle sue catene commerciali.

Scorri verso il basso per scoprire di più sull' algoritmo DALL-E di realtà aumentata.

"The courage to be real" BY STUART VEVERS
"Tech CEOs imposing their will unto te art world in the style of Cindy Sherman" BY ALEXIS SCHWARZ

Artisti come Trevor Panglen e la ricercatrice Kate Crawford hanno riscritto le label e le hanno nutrite attraverso il proprio sistema brevettato per creare nuovi data. Il collettivo parigino Obvious ha creato un sistema GAN utilizzando i ritratti dipinti tra il XIV e il XX secolo, generando poi un ritratto AI battuto da Christie’s a 432.500 dollari. Nel frattempo “Deep Meditations”, il film del 2018 di Memo Akten, si alle- nava su immagini taggate con concetti astrattisti che descrive- vano il senso dell’esistenza. Il mezzo ha preso piede, incoraggia- to dagli approcci di metodologia critica di Casey Reas, Lev Manovich, Arthur I. Miller e Nora N. Khan, da compratori interessati e da approcci innovativi alla decostruzione del GAN. Superstar della GAN Art come Refik Anadol e Mario Klingemann e alunni della residenza Arts & Culture di Google hanno cominciato a emergere, mentre le istituzioni, incluso il MoMA e il Centre Pompidou, hanno spalancato le loro porte. Il mondo dell’arte ha finalmente trovato una lente attraverso cui i GAN possono avere senso, in primo luogo come un sovvertimento delle loro origini nella Valley. I titoli delle immagini creati dagli artisti sono diventati un approccio carico di sfumature all’esame dei nostri sistemi di vita e di percezione. Nel luglio 2022 è stata rilasciata un’altra iterazione GAN: il suo nome è DALL-E 2. Un brillante mix tra il WALL-E di Pixar e Salvador Dalì, potrebbe essere una delle tecnologie più straordinarie e potenzial- mente apocalittiche mai create. Frutto dell’ingegno degli im- prenditori tech Elon Musk, Greg Brockman, Ilya Sutskever, Wojciech Zaremba e John Schulman, Open AI - il capogruppo di DALL-E - ha creato delle capacità generative fatte su misu- ra per il mondo dell’arte senza precedenti. Siete interessati a un “Alien in pellicola Kodak 400 in stile Annie Leibovitz”? DALL-E 2 ce l’ha.

“La Corte Suprema si mette a ballare in pista in stile Norman Rockwell”? Sissignore, DALL-E 2 può farlo. Prima d’ora non c’era mai stato un generatore text-to-i- mage per il mondo dell’arte e prima d’ora mai nessuno era stato adottato così velocemente. Alla fine dell’estate 2022, OpenAI ha spedito un milione di inviti DALL-E 2 beta a insider, inclusi artisti, giornalisti, ricercatori, imprenditori e taste-makers. E in una settimana DALL-E 2 era onnipresente su Instagram, nelle chat di gruppo e su Twitter. Pittori e imprenditori tech hanno allo stesso modo adottato il generatore: la cover-star Emma Stern ha fatto dei post e il miliardario co-fondatore di LinkedIn Reid Hoffman ha venduto le sue creazioni DALL-E 2 per 24mila dollari sul marketpalce di NFT, Magic Eden. Usando lo schema del Fyre Festival (il famoso quadrato aran- cione), DALL-E 2 è diventato cool. Ma, come lo sciagurato festival, è importante notare che gli user non sono i benefattori e che il management è in crisi. OpenAI ha operato una metamorfosi rispetto al suo statuto originario, dove il claim della società era: «Il primo dovere fiduciario è verso l’umanità», quando ha sviluppato AGI - una macchina che ha poteri di apprendimento e ragionamento propri della mente umana, su- perando la linea della singolarità. La tecnologia AGI, temuta da chi ne comprende la minaccia esistenziale, sarebbe meno appetibile se fosse patrocinata dall’avidità di danarose realtà corporate, perciò per iniziare, OpenAI è stata registrata come una no-profit. 

fashion dress clothing gown formal wear person
"Post Apocalyptic garbage high priestess divine" BY JULIA FOX

Come ha scritto Karen Hai su MIT Technology Review: «Sebbene non sia mai stata esplicitata una critica, l’implicazione era chiara: altri laboratori, come DeepMind, potreb- bero non servire l’umanità perché guidati da interessi commer- ciali. Mentre quelli sono chiusi, OperAI potrebbe essere open». O almeno così abbiamo pensato. Con un balzo in avanti di pochi anni, OpenAI ha revocato il suo statuto no-profit e si è registrata come impresa nel 2019 - una decisione controversa e una scelta cruciale. Subito dopo l’annuncio, Elon Musk, che crede che l’AI sia: «Potenzialmente più pericolosa della bomba atomica», è uscito da OpenAI con un tweet: «Ero in disaccordo con alcune delle cose che il team di OpenAI voleva fare». Da lì, l’addio di suoi impiegati che si sono sentiti ingannati dal volta-faccia sugli ideali e un miliardo di investimenti di Microsoft. Non essendo più l’istituto di ricerca che prometteva di essere “open”, la crescita del profitto è diventata una responsabilità legale dell’azienda. I suoi fan nella Silicon Valley che avevano caldeggiato la supervisione di AGI nel contesto no-profit, hanno perso fiducia, mentre la risposta pavloviana degli investitori al profitto ha scatenato un’acquolina in bocca finanziaria. OpenAI aveva dunque bisogno di rifarsi un’immagine e DALL-E è diventata il modo divertente di ritrovare il favore pubblico. DALL-E è sciocco, trendy, strabiliante, incredibilmente virale - e disponibile solo per chi rispetta il suo metodo. All’inizio, gli user non erano autorizzati a vendere opere d’arte generate con DALL-E e il modello alla base non apprendeva più nulla (ovvero non raccoglieva le immagini create come dati). Ma, come no-profit, il modello di business non era sostenibile e in grado di generare il necessario ritorno di capitali, inoltre era soggetto al cambiamento, un’evoluzione già in corso. 

publication person horse mammal animal book comics equestrian
"Western Novel Cover Art of a Cowboy on Horseback Jumping over a Can of Corn Cooking above a Campfire" BY CANYON CASTATOR

Da luglio, DALL-E 2 è passato dall’essere a pagamento a gratuito e ha rimosso il veto alla vendita di generative art. Le sessioni aggiornate sono state rilasciate agli utenti, il codice di condotta ammorbidito, con la conseguente release pubblica del generatore che ha aggiunto milioni in più di user e di generazioni. Sebbene la versione free sembri antitetica al profitto, Tristan Harris, ex-designer di Google e co-fondatore del Centre for Humane Technology, spiega: «Se non paghi per il prodotto, allora sei tu il prodotto». Questo modello non è mai a vantaggio degli utenti. I recenti cambiamenti in DALL-E 2 presentano alcuni problemi etici: innanzitutto, il fatto di diventare prodotto, raccogliere dati sul cervello dell’artista e decostruire l’esperienza umana come parte delle ambizioni di sviluppare AGI non è mai chiaramente spiegato. In secondo luogo, generare un lavoro “nello stile di” e poi vendere quel lavoro è eticamente dubbio e potenzialmente fatale per gli artisti e la loro proprietà intellettuale. La possibilità di fare ricerca “in the style of” ha implicazioni drammatiche sulla proprietà intellettuale e i circa 200 impiegati di OpenAI mancano degli strumenti per affrontare questa preoccupazione. Se un artista possiede una creazione, possiede anche i suoi derivati creativi? Se si genera “un gatto che cavalca un mostro nello stile di Basquiat. OpenAI non versa un assegno agli eredi di Basquiat. Ma se lo facesse? Una stratificazione della gestione dei diritti commerciali potrebbe offrire controllo e compensazione per quell’ITSO (In the Style of), ma anche in questo caso potrebbero esserci conseguenze involontarie. Cosa ci vuole per determinare ITSO? Quanto labili sono i confini del “nello stile di”? Quanto è ampio lo spazio dello stile artistico? Quanti specifici stili possono esistere? Supponiamo che gli stili individuali abbiano delimitazioni ampie, per rendere lo spazio dei possibili stili finito e limitato. In quel caso, questo potrebbe trasformarsi in una corsa precipitosa per stabilire un precedente e reclamare una certa parte dello spazio di uno stile. Gli artisti possono avere due distinte fasi nelle loro carriere: prima avranno bisogno di generare un livello sufficiente di novità, far sì che venga introiettato nel set di allenamento di DALL-E e poi applicarlo a un singolo stile. Nella seconda fase della loro carriera, monetizzeranno il loro stile utilizzando il sistema per generare nuovi materiali grazie al proprio vettore di stile, oppure concedendo ad altri di usarlo per creare nuova arte ed essere compensati passivamente. Se ITSO può essere limitato eticamente, la compensazione sarà necessaria se DALL-E 2 implementa un sistema di gestione dei diritti. Qualunque tipo di approccio finanziario necessiterà di una confronto con l’artista, di cui al momento pare esserci poca traccia. Già ora, gli utenti abusano di ITSO, piantando in asso gli artisti. Gli artisti dovrebbero avere una miriade di opzioni creative e commerciali, se ITSO prosegue così com’è, incluse un fee per l’utilizzo, o il razionamento di un limitato numero di ITSO da ottenere tramite un’asta. Alcuni artisti possono richiedere una approvazione del flusso di lavoro, in cui gli artisti approvano l’opera d’arte e l’utente versa un fee significativo. Oppure un artista può restringere l’uso di ITSO solo a se stesso e sfruttarlo per scalare la propria produzione. Ma anche questo presenta una serie di problemi. Gli artisti che usano la tecnologia per incrementare la produzione non sono un dilemma infondato, nel momento in cui le programmazioni delle gallerie e delle fiere d’arte richiedono che un artista produca costantemente opere. 

head person face giraffe wildlife animal mammal
"Giraffe Mustache" BY BILL POWERS

È una sgradevole e spesso non discussa verità che porta a un momento particolarmente cupo nell’arte. Una tale pressione può spingere gli artisti a usare DALL-E 2 per rispettare le consegne, sebbene il generatore non abbia soggettività, o esperienza viva, e utilizzi delle caption sottostanti non pertinenti al lavoro e, perciò, radicamente disconnesse. Ci sarebbe un rifiuto? Una necessità di trasparenza? In un mercato vivace, se si continua a buttare fuori ciò che vende, c’è qualcuno che si pone delle domande necessarie? Sebbene ci possa essere un approccio distintivo alla ricerca, la vecchia pratica del “trovare” e “ruminare” diventerà sempre più rara. In effetti, la velocità di accumulo di un vocabolario visivo non è un problema che deve essere risolto, ma un tema che ha bisogno di una decelerazione, se si vuole garantire una eredità dell’arte. Se il Maestro ha immaginato un orologio che cade da un tavolo, c’è solo bisogno di dare l’input su Google, Pinterest, DALL-E 2, o peggio ancora, sull’open source Stability Diffusion. Queste migliorie tecnologiche ci consentono di bypassare l’immaginazione andando alla ricerca dell’immagine perfetta, recapitata sul proprio desktop per ordine di un algoritmo. E questo nonostante l’AI non abbia comprensione dell’esperienza umana, nonostante il programmatore abbia fatto del suo meglio per replicare la singolarità creativa (presupponendo che questo sforzo sia stato una priorità per l’ethos della Silicon Valley). Non è polemico affermare che i generatori text-to-image puntino a rimpiazzare la creazione con una tecnica di raccolta dati, il che significa che non aderiscono ai confini etici ed eterei che l’arte e l’umanità hanno istituzionalizzato. Senza una protezione da ITSO, il cieco contribuire all’AGI sembra fuorviante e pericoloso. In tal senso, DALL-E 2 semplicemente amplifica il tema dell’attuale era di flop commercializzato, riducendo il tutto al rispettare i tempi di consegna richiesti dalle gallerie e mancando del rispetto basico per il processo creativo. L’innovazione è profondamente problematica e, per questo motivo, non dovrebbe essere presa alla leggera, sebbene sia incredibilmente divertente. Quest’ultimo punto è un aspetto notevole perché, per quando nichilisti DALL-E 2 possa renderci, è un vero spasso giocarci.

finger person hand body part baby face head eating food
"A Baby but a Man eating a Ham" BY AUSTYN WEINER

Tags

Articoli consigliati