Shutterstock venderà foto generate dall’Intelligenza Artificiale

Shutterstock si è alleato con OpenAi, creatore del sistema DALL-E, per vendere immagini create dall’intelligenza artificiale.

Il gigante del microstock ha annunciato questa collaborazione il 25 ottobre scorso, dichiarando di voler rendere questa nuova tecnologia disponibile per tutti. Il progetto sarà lanciato nei prossimi mesi e consentirà agli utenti di generare immagini digitando le parole chiave richieste e scaricando direttamente i risultati.

Per esempio, digitando la frase “astronauta a cavallo in stile fotorealistico” tramite l’interfaccia messo a disposizione da Shutterstock, la piattaforma OpenAI-DALL-E potrà generare un’immagine artificiale con quelle caratteristiche, come la demo visibile sul sito di OpenAi, che fornisce altri interessanti esempi.

An astronaut riding a horse - Image generated by DALL-E2
Immagine generata da DALL-E2 con la frase chiave “an astronaut riding a horse in a photorealistic style”.

DALL-E (il nome è un omaggio a Salvador Dalì e al robot WALL-E della Pixar) è una variante del famoso modello di elaborazione del linguaggio naturale GPT-3 che è in grado di creare testi incredibilmente benfatti, spesso non distinguibili da quelli prodotti da una mente umana. DALL-E, invece, è specializzato nella creazione di immagini.

Un fenomeno in rapida espansione

In rete esistono già diverse piattaforme online basate sulla tecnologia DALL-E, come Craiyon e Jasper Art, che permettono di generare immagini sulla base di una richiesta testuale. Craiyon è gratuito, ma utilizza DALL-E Mini, una versione ridotta e meno sofisticata di DALL-E2, con risultati più scadenti.

Il risultato non è sempre dei migliori, ma i progressi sono impressionanti ed è probabile che presto si arriverà a risultati ancora più sorprendenti. Il fenomeno infatti si sta diffondendo rapidamente con investimenti notevoli. DALL-E, per esempio, è finanziata da colossi come Microsoft e Google.

Immagine ottenuta digitando sulla piattaforma Craiyon la frase chiave “a shark flying over a city”.

Infatti Anche Microsoft ha annunciato il mese scorso che implementerà questo modello in alcuni prodotti e Google ha lanciato recentemente Parti e Imagen, sempre basati su DALL-E2, che per ora però non sono a disposizione del pubblico.

Ma DALL-E2 non è l’unica tecnologia di questo tipo. Tra le varie proposte spicca per esempio Midjourney, un modello che gira sulla piattaforma Discord e che è in grado di creare immagini artistiche in vari stili e sorprendentemente dettagliate; ora però (novembre 2022) è in via di sviluppo una sua versione beta chiusa, accessibile solo su invito. In alternativa, ci sono altre piattaforme online già utilizzabili come Starryai, Photosonic, Wombo Dream, Pinegraph (basata sul modello open source Stable Diffusion) e tante altre.

Insomma, il fenomeno degli AI image generator si sta diffondendo rapidamente e le proposte sono davvero numerose. Il servizio può essere a pagamento, ma spesso è gratuito. Lo scopo è ottenere opere d’arte NFT, stampe, immagini editoriali o anche solo da condividere sui social media.

Questa immagine proposta da Jason Allen, intitolata Théâtre D’opéra Spatial, è stata creata usando una combinazione di Intelligenza Artificiale e Photoshop e ha vinto quest’anno nella categoria Arte digitale della Colorado State Fair.

Il problema del copyright

Ma come funzionano questi modelli? I generatori di immagini con intelligenza artificiale sono addestrati con il metodo del deep learning, fornendo loro milioni e milioni di foto e le relative descrizioni. È come mostrare a un bambino un’immagine e insegnargli come si descrive. In questo modo imparano a identificare le cose tramite fotografie create da persone reali.

In pratica, i programmatori insegnano agli algoritmi di apprendimento automatico a generare immagini dai prompt (richieste) di testo fornendo loro prima milioni di foto della vita reale e le loro descrizioni tratte da un data base di immagini realizzate da autori reali, fino a quando gli algoritmi (la parte di intelligenza artificiale del processo) imparano a renderizzare le proprie in base a ciò che gli è stato mostrato in precedenza. A questa funzione sono poi in grado di aggiungere livelli successivi e più complessi di elaborazione combinando concetti, attributi e stili per costruire vere e proprie chimere.

Tra le tante questioni sollevate da questa nuova tecnologia, c’è dunque anche quella dei diritti. Attualmente non ci sono leggi precise sul copyright delle immagini generate dall’intelligenza artificiale create da algoritmi addestrati con foto reali. Per ora Shutterstock ha affermato che i contributori le cui immagini sono incluse nella formazione del modello riceveranno un pagamento dal suo Contributor Fund. Non è stato ancora chiarito in che termini, ma probabilmente si tratterà di compensi irrisori.

Le parole sono importanti

Evidentemente l’impatto degli AI image generator sul concetto di autore e anche su quello di opera d’arte è notevole, ma non è questa la sede per parlarne. Qui, dove ci si occupa di catalogazione e del rapporto tra testo e immagine per il suo reperimento, è importante sottolineare che digitare correttamente il testo per richiedere l’immagine desiderata è fondamentale nel processo della sua creazione. Per esempio, DALL-E 2 funziona meglio con frasi lunghe e complesse, mentre le frasi brevi lo confondono, perché troppo generiche.

Sapere cosa scrivere nel testo della richiesta (prompt) è dunque molto importante per ottenere i risultati desiderati. Al punto che ci sono siti Web in cui è possibile trovare testi che permettono di risparmiare tempo in inutili tentativi. Ad esempio The DALL·E 2 Prompt Book (che è gratuito) fornisce numerosi esempi di prompt per DALL-E2, mentre Phraser.tech è uno strumento che aiuta a comporre prompt sia per DALL-E che per Stable Diffusion che per Midjourney.

Grandi opportunità, rischi inquietanti

Questa nuova strada delle immagini generate dall’intelligenza artificiale e dunque create dal algoritmi apre a opportunità finora impensabili. Le potenzialità creative sono immense e hanno già attirato l’attenzione di molti fotografi che hanno cominciato a usare questa tecnologia per comporre le loro opere e metterle in vendita sui siti di microstock. Le reazioni di questi ultimi sono state diverse. Abbiamo visto che Shuttertock, dopo un rifiuto iniziale, adesso le ammette, mentre altre piattaforme, come Getty Images, per ora continuano a rigettarle.

È un momento di passaggio in cui non è tutto chiaro. Dei problemi giuridici riguardo al copyright e di quelli estetici sul concetto di autore ed opera d’arte si è già accennato, ma anche le implicazioni etiche sono piuttosto inquietanti.

“I mezzi per esprimere la creatività sono in continua evoluzione ed espansione. Riconosciamo che è nostra grande responsabilità abbracciare questa evoluzione e garantire che la tecnologia generativa che guida l’innovazione sia fondata su pratiche etiche”, ha dichiarato Paul Hennessy, amministratore delegato di Shutterstock .

Resta che Google, Meta e la stessa OpenAI non hanno ancora reso pubblico l’accesso ai loro modelli, o lo hanno fatto in modo limitato e controllato proprio per i pericoli che comportano. Infatti, come scrive Alessandro Nodari su Smartworld:

“… Se l’IA si allena perlustrando il web o i social, i risultati non sono confortanti, visto che è pieno di frasi e immagini razziste, violente o comunque non appropriate. […] Nel caso di DALL-E 2, i dipendenti hanno rimosso i contenuti violenti dai dati di formazione e sono disponibili filtri che impediscono a DALL-E 2 di generare immagini se gli utenti inviano richieste che potrebbero violare le politiche aziendali contro nudità, violenza, cospirazioni o contenuti politici. Nondimeno, DALL·E 2 e tutti i grandi modelli di intelligenza artificiale hanno difficoltà ad affrontare alcune problematiche, in quanto hanno pregiudizi che possono danneggiare in particolare le minoranze o aggravare i problemi della nostra società.”


Qui è possibile iscriversi alla lista d’attesa di shutterstock:

Sgutterstock.AI

Per aprire un account su DALL-E:

https://openai.com/dall-e-2/

Altri link per creare immagini con l’intelligenza artificiale:

https://www.jasper.ai/art?fpr=adam19

https://creator.nightcafe.studio/

https://photosonic.writesonic.com/

https://stablediffusionweb.com/

https://www.craiyon.com/

https://deepdreamgenerator.com/

https://dream.ai/

https://www.starryai.com/

https://www.artbreeder.com/

https://pinegraph.com/

https://replicate.com/pixray/text2image

https://simplified.com/ai-image-generator/

https://deepai.org/machine-learning-model/text2img

https://www.canva.com/features/ai-image-generator/

https://hotpot.ai/art-generator

https://creator.nightcafe.studio/text-to-image-art

https://www.fotor.com/features/ai-image-generator/


Pubblicato

in

da

Translate »