I giganti della tecnologia stanno affrontando una corsa al recupero dei dati per alimentare i loro sistemi di intelligenza artificiale, capita sempre più spesso che tentino di superare le politiche aziendali o che discutano di come aggirare le leggi sul copyright per ottenere le informazioni necessarie.
OpenAI, Google e Meta hanno esaurito le risorse di dati convenzionali, per cui ora si riovolgono a metodi non convenzionali per raccogliere testo, immagini e altro materiale online. OpenAI, ad esempio, ha creato uno strumento di trascrizione vocale per estrarre testo da video di YouTube, nonostante le potenziali violazioni delle politiche di YouTube e dei diritti d’autore dei creatori.
Anche Google ha utilizzato trascrizioni di video di YouTube per addestrare i suoi modelli di IA, mentre Meta ha discusso di acquistare una casa editrice per ottenere maggiori risorse di testo.
Queste azioni evidenziano la crescente importanza dei dati online per l’industria IA, con aziende che affrontano la possibilità di esaurire le risorse di dati di alta qualità già entro il 2026.
Leggi l’articolo completo: How Tech Giants Cut Corners To Harvest Data for A.I. su nytimes.com.
Immagine generate tramite DALL-E 3 da M.B.