Cerca
Close this search box.

Come fanno OpenAI, Google e Meta a superare le barriere per raccogliere dati online?

Immagine generata tramite DALL-E 3 da Marta Baronio (autrice articolo) che rappresenta astrattamente i vari loghi dei social Meta, logo di google e altri in una nuvola, frutto della polvere generata da una corsa rapida di vari soggetti (che vanno talmente in fretta che si vedono solo scie, e la nuvola di polvere).

I giganti della tecnologia stanno affrontando una corsa al recupero dei dati per alimentare i loro sistemi di intelligenza artificiale, capita sempre più spesso che tentino di superare le politiche aziendali o che discutano di come aggirare le leggi sul copyright per ottenere le informazioni necessarie.

OpenAI, Google e Meta hanno esaurito le risorse di dati convenzionali, per cui ora si riovolgono a metodi non convenzionali per raccogliere testo, immagini e altro materiale online. OpenAI, ad esempio, ha creato uno strumento di trascrizione vocale per estrarre testo da video di YouTube, nonostante le potenziali violazioni delle politiche di YouTube e dei diritti d’autore dei creatori.
Anche Google ha utilizzato trascrizioni di video di YouTube per addestrare i suoi modelli di IA, mentre Meta ha discusso di acquistare una casa editrice per ottenere maggiori risorse di testo.

Queste azioni evidenziano la crescente importanza dei dati online per l’industria IA, con aziende che affrontano la possibilità di esaurire le risorse di dati di alta qualità già entro il 2026.

Leggi l’articolo completo: How Tech Giants Cut Corners To Harvest Data for A.I. su nytimes.com.

Immagine generate tramite DALL-E 3 da M.B.

Accedi per vedere questi contenuti

registrati se non lo ha ancora fatto