Google rivoluziona gli LLM con Infini-attention, che introduce il contesto infinito
Google introduce una rivoluzionaria tecnica che offre ai grandi modelli linguistici un contesto infinito. Questa tecnica si chiama Infini-attention, amplia la “finestra di contesto” dei modelli consentendo la gestione di testi di lunghezza illimitata, senza aumentare i requisiti di memoria e calcolo. Questo significa che gli LLM possono ora lavorare su input estesi senza compromettere […]
L’Analisi dell’Ufficio Federale Tedesco per la Sicurezza delle Informazioni sui modelli IA generativi
Il rapporto dell’Ufficio Federale Tedesco per la Sicurezza delle Informazioni, intitolato “Modelli IA Generativi – Opportunità e Rischi per l’Industria e le Autorità”, mette in luce le sfide e le opportunità nell’addestramento di modelli IA generativi, come gli LLM. Basandosi su grandi corpus di testo, questi modelli possono incorporare dati non verificati, compresi contenuti personali […]
MGE, la chiave per un allineamento morale efficace nei modelli linguistici
Un nuovo studio finanziato da OpenAI propone un approccio innovativo all’allineamento morale per i modelli linguistici LLM. L’allineamento morale, cruciale nell’era dell’IA, sta diventando un problema il cui peso aumenta sempre di più nel tempo. Il processo introdotto da quest’approccio innovativo si chiama MGE, “Moral Graph Elicitation” (Elicitazione del Grafo Morale), i cui risultati, secondo […]
Rapporto AI Index 2023, un anno cruciale per l’IA
Il “Rapporto AI Index 2023” è atterrato rumorosamente sulla scena con le sue 393 pagine cariche di informazioni che testimoniano l’uscita dell’IA da un anno cruciale. Pubblicato dall’Istituto Stanford per l’Intelligenza Artificiale Centrata sull’Uomo (HAI), il rapporto offre uno sguardo dettagliato sul panorama attuale dell’IA, esaminandone diversi aspetti chiave, tra cui l’espansione dell’IA generativa, i […]
I dubbi etici dietro l’uso dei dati: OpenAI e il caso YouTube
OpenAI, alla ricerca di dati per addestrare ChatGPT, ha trascritto oltre un milione di ore di video di YouTube partecipando così alla corsa all’accesso ai dati nel mondo dell’IA. OpenAI avrebbe attinto alla popolare piattaforma video senza aver mai informato Alphabet, la società che controlla sia YouTube sia Google. Sembrerebbe però che OpenAI, e in particolare […]
OpenAI, Google e Mistral in competizione con rilasci sempre più intensi di nuove IA generative.
La competizione nel campo dell’intelligenza artificiale si fa sempre più intensa con i recenti rilasci di nuovi modelli da parte di OpenAI, Google e Mistral, avvenuti entro soli 12 ore l’uno dall’altro. Il susseguirsi rapido dei rilasci avviene mentre il settore si prepara al prossimo lancio della nuova versione principale di GPT. Il primo rilascio […]
Come fanno OpenAI, Google e Meta a superare le barriere per raccogliere dati online?
I giganti della tecnologia stanno affrontando una corsa al recupero dei dati per alimentare i loro sistemi di intelligenza artificiale, capita sempre più spesso che tentino di superare le politiche aziendali o che discutano di come aggirare le leggi sul copyright per ottenere le informazioni necessarie. OpenAI, Google e Meta hanno esaurito le risorse di […]
Gli studiosi di Anthropic scoprono come manipolare le risposte dell’IA
Gli studiosi di Anthropic hanno scoperto un nuovo metodo, chiamato “many-shot jailbreaking”, per indurre un modello linguistico AI a rispondere a domande inappropriate dopo essere stato esposto a numerose domande meno dannose. Questo approccio sfrutta la capacità dei modelli LLM con ampie “finestre di contesto”, che tendono a performare meglio su molte attività se ci […]
Mistral, una startup francese che mette in discussione il dominio di OpenAI
La startup francese Mistral sta mettendo in discussione il dominio di OpenAI nel campo dei grandi modelli linguistici (LLM). Nonostante sia più piccola e giovane rispetto al gigante americano, Mistral ha lanciato con successo il suo modello Mistral-Large, che si avvicina quasi alle prestazioni del potente GPT-4 di OpenAI. Inoltre, Mistral ha presentato Le Chat, […]
LLM: dalla complessità alla semplicità nel recupero delle conoscenze
I modelli linguistici di grandi dimensioni utilizzano una tecnica sorprendentemente semplice per recuperare informazioni memorizzate e i ricercatori hanno scoperto un metodo per esplorare ciò che questi modelli sanno su nuovi argomenti. Questi modelli (come ChatGPT) sono complessi, ma l’uso di funzioni lineari per decodificare le informazioni suggerisce che ci sono meccanismi più semplici al […]