Cerca
Close this search box.

Fare dei video senza fotocamera? Sora: il ChatGPT dei video è alle porte.

OpenAI (l’azienda sviluppatrice di ChatGPT) ha presentato Sora, un innovativo sistema text-to-video in grado di generare video fotorealistici di un minuto a partire da messaggi testuali (prompt). Si potrebbe dire che Sora fa per i video quello che ChatGPT fa per la scrittura. Sora crea clip che spaziano da scenari fantastici (“due astronauti in un pianeta ghiacciato”) a momenti intimi che potrebbero essere scambiati per filmati creati col proprio cellulare (“riflesso sul finestrino di un treno che attraversa la periferia di Tokyo”). Nonostante le sue imperfezioni, tra cui una qualità a volte eccessivamente perfetta e cartoonesca, la tecnologia di Sora è in grado di imitare in modo impressionante la “texture” della vita reale.

Sora, attualmente in anteprima limitata, rappresenta un balzo in avanti verso la simulazione del mondo fisico. OpenAI sostiene che Sora “comprende non solo ciò che l’utente ha chiesto nel prompt, ma anche come queste cose esistono nel mondo fisico”. In modo statistico, inconscio, “capisce” come diversi tipi di oggetti si muovono nello spazio e nel tempo e interagiscono tra loro. Allontanandosi dalla mera manipolazione dei pixel, mostra una “comprensione” degli oggetti e degli spazi in movimento immaginando scene tridimensionali che si dispiegano nel tempo, anche senza conoscere le leggi della fisica e le relazioni causa-effetto.

Le implicazioni della tecnologia video sintetica come Sora sono vaste, dal suo potenziale nella cinematografia e nella pubblicità ai rischi dei deepfakes. Ma anche sollevando questioni relative alla privacy e all’uso dei dati personali. Inoltre, man mano che questa tecnologia diventa più accessibile, può alterare la percezione del video come mezzo, mettendo in discussione la nostra fiducia nei contenuti video e la distinzione tra filmati sintetici e reali. Questo cambiamento suggerisce un futuro in cui la generazione di memorie sintetiche potrebbe diventare comune, trasformando la nostra interazione con i media e confondendo i confini tra realtà e rappresentazione artificiale.

Articolo completo su The New Yorker.
Foto di Thomas William su Unsplash.

Accedi per vedere questi contenuti

registrati se non lo ha ancora fatto