Il crawler di addestramento di OpenAI è finito in una sorta di loop esplorando “la più noiosa fattoria di contenuti del mondo” online, creata da John Levine, autore di “Internet for Dummies”.
Questo sito, composto da miliardi di pagine con nomi generati casualmente, ha intrappolato il bot di OpenAI che ha navigato sulle pagine più di 3 milioni di volte in pochi giorni. Levine, trovando l’accaduto divertente, ha condiviso l’incidente su un gruppo online di sviluppatori web, mettendo in luce la tipoligia di estrazione dati indiscriminata che OpenAI sta facendo per addestrare i suoi modelli di IA. Levine ha anche sottolineato che questa non è la prima volta che un bot si blocca nella sua “fattoria di contenuti”, evidenziando le sfide pratiche di gestire i web spider.
Quest’episodio solleva interrogativi sull’approccio di OpenAI all’addestramento dei suoi modelli e sulle sue implicazioni pratiche di tale approccio.
Leggi l’articolo completo: OpenAI Training Bot Crowls ‘World’s Lamest Content Farm’ 3 Million Times in One Day su 404media.co.
Immagine generate tramite DALL-E 3 da M.B.