Un nome strano e prospettive futuristiche ma cos’è davvero DALL-E?
Come scritto su Wikipedia: “DALL-E è un algoritmo di intelligenza artificiale capace di generare immagini a partire da descrizioni testuali”.
È stato sviluppato da OpenAI ed è stato presentato il 5 gennaio 2021.
Nonostante sia passato più di un anno è ancora una novità per molti.
Facciamo un passo indietro per spiegare la portata di questa innovazione.
Cosa succede quando fai incontrare il grande pittore surrealista Salvador Dalì con l’adorabile robot della Pixar Wall-E?
Nasce così un nuovissimo modello di intelligenza artificiale di OpenAI. Almeno è per questo che l’hanno chiamato DALL-E.
Dopo il tanto pubblicizzato e discusso rilascio OpenAI di GPT-3, il modello di linguaggio basato su reti neurali di OpenAI, è costruito per trovare modelli nei dati e per utilizzare quei modelli per completare i prompt scritti (attraverso la scansione di 175 miliardi di parametri).
Per dovere di cronaca, va anche detto che dietro c’è OpenAI che per chi non lo sapesse è la società di ricerca e sviluppo fondata da Elon Musk nel 2015 (e attualmente parte di Microsoft).
Per Open Ai, DALL-E “è una versione di 12 miliardi di parametri di GPT-3 addestrata per generare immagini da descrizioni di testo, utilizzando un set di dati di coppie testo-immagine”.
DALL-E è basato sul motore GPT-3, che trova schemi nei dati e li usa per completare i prompt di testo, ma invece di creare risposte scritte (stranamente umane), DALL-E usa quei prompt per creare immagini generate automaticamente combinando interpretazioni visive di ciascuna serie di parole chiave.
Ad esempio, se chiedi a DALL-E di creare un’immagine di “un tavolo da salotto a forma di cuore”, produce questo tutta una serie di immagini molto ma molto diverse tra loro.