Come fanno OpenAI, Google e Meta a superare le barriere per raccogliere dati online?

I giganti della tecnologia stanno affrontando una corsa al recupero dei dati per alimentare i loro sistemi di intelligenza artificiale, capita sempre più spesso che tentino di superare le politiche aziendali o che discutano di come aggirare le leggi sul copyright per ottenere le informazioni necessarie.

OpenAI, Google e Meta hanno esaurito le risorse di dati convenzionali, per cui ora si riovolgono a metodi non convenzionali per raccogliere testo, immagini e altro materiale online. OpenAI, ad esempio, ha creato uno strumento di trascrizione vocale per estrarre testo da video di YouTube, nonostante le potenziali violazioni delle politiche di YouTube e dei diritti d’autore dei creatori.
Anche Google ha utilizzato trascrizioni di video di YouTube per addestrare i suoi modelli di IA, mentre Meta ha discusso di acquistare una casa editrice per ottenere maggiori risorse di testo.

Queste azioni evidenziano la crescente importanza dei dati online per l’industria IA, con aziende che affrontano la possibilità di esaurire le risorse di dati di alta qualità già entro il 2026.

Leggi l’articolo completo: How Tech Giants Cut Corners To Harvest Data for A.I. su nytimes.com.

How Tech Giants Cut Corners to Harvest Data for A.I.

OpenAI, Google and Meta ignored corporate policies, altered their own rules and discussed skirting copyright law as they sought online information to train their newest artificial intelligence systems.

Immagine generate tramite DALL-E 3 da M.B.

Come fanno OpenAI, Google e Meta a superare le barriere per raccogliere dati online?

Contenuti correlati

Accedi per vedere questi contenuti