Un team di ricercatori della gigante cinese del commercio e della tecnologia Alibaba ha pubblicato questa settimana un articolo dettagliato su un nuovo modello, chiamato “Animate Anyone“. La reazione online è stata in generale “RIP TikTokers”, con l’implicazione suggerita che i creatori di contenuti di danza su TikTok saranno presto sostituiti dall’intelligenza artificiale.
Il modello prende in input (nei loro esempi, video di danza su TikTok) e crea una nuova versione in output. I risultati sono leggermente migliori rispetto a tentativi precedenti di modelli simili. Principalmente, negli esempi pubblicati, prendono una sequenza di danza esistente e la replicano leggermente peggio, con abbigliamento o stili diversi. Ma come per tutti gli avanzamenti dell’IA, continuerà a migliorare.
Già si è fatto notare che “Animate Anyone” sarà probabilmente utilizzato per scopi abusivi, generando video non consensuali di persone in situazioni fabbricate, che è stata la principale utilizzazione dei deepfake fin dalla loro creazione sei anni fa.
Questa previsione non è lontana: questi ricercatori stanno già utilizzando il lavoro delle persone senza il loro consenso, come pratica integrata nella formazione e nella costruzione del modello. Il paper di Alibaba rappresenta la commercializzazione del “dataset di TikTok”, originariamente creato per scopi accademici dai ricercatori dell’Università del Minnesota.
I ricercatori di Alibaba scrivono nel loro paper di utilizzare “il dataset di TikTok, comprendente 340 video di allenamento e 100 video di test di singoli umani che ballano (di 10-15 secondi)”. Questo dataset ha avuto origine da un progetto del 2021 dell’Università del Minnesota che descriveva una tecnica per “la stima dell’alta fedeltà delle profondità degli umani vestiti guardando video di danza sui social media”, come mettere un nuovo vestito a qualcuno in un video utilizzando l’IA.
La maggior parte dei dataset dell’IA è composta da video, immagini e testi estratti dal web aperto, compresi i social network come TikTok, senza il consenso dei proprietari di quel contenuto. In questo caso, un dataset compilato e lanciato da dottorandi è utilizzato da una delle più grandi aziende tecnologiche e commerciali del mondo.
Questo percorso, in cui un gigantesco dataset viene creato per scopi di ricerca accademica e poi alla fine commercializzato da grandi aziende per scopi simili o totalmente diversi, è comune. Ricercatori presso l’Università del North Carolina, Wilmington, hanno estratto video caricati da persone trans su YouTube in un database utilizzato per creare tecnologia volta a rilevare persone trans utilizzando il riconoscimento facciale, ad esempio.
Leggi qui l’intero articolo: Alibaba’s ‘Animate Anyone’ Is Trained on Scraped Videos of Famous TikTokers