Ricercatori del Massachusetts Institute of Technology e Microsoft hanno sviluppato un nuovo metodo per ridurre l’incidenza di “allucinazioni” nei modelli di linguaggio di grandi dimensioni (LLM). Chiamato “Decoding by Contrasting Layers” (DoLa), il metodo contrasta le differenze negli output di diverse parti di un modello per migliorare l’accuratezza dei fatti generati.
I modelli di linguaggio, come GPT-4 di OpenAI, sono programmi di intelligenza artificiale in grado di generare testo in risposta a determinate istruzioni. Tuttavia, a causa della loro dipendenza dall’apprendimento automatico e dalla vastità dei dati su cui sono addestrati, questi modelli possono a volte generare contenuti che si discostano dai fatti osservati durante il pre-training, un fenomeno noto come “allucinazione”.
Il team di ricerca, guidato da Yung-Sung Chuang del MIT e Yujia Xie di Microsoft, ha proposto DoLa come strategia di decodifica per ridurre le allucinazioni nei LLM preaddestrati. A differenza dei metodi esistenti, DoLa non richiede l’accesso a conoscenze esterne né ulteriori operazioni di fine-tuning del modello.
DoLa funziona sfruttando il fatto che la conoscenza fattuale in un LLM è generalmente localizzata in specifici layer del modello. Il metodo contrasta le differenze nei logit (i valori di output grezzi del modello prima della normalizzazione) ottenuti proiettando i layer successivi rispetto ai layer precedenti nello spazio del vocabolario. In questo modo, DoLa riesce a far emergere meglio la conoscenza fattuale e a ridurre la generazione di fatti errati.
I ricercatori hanno scoperto che DoLa migliora costantemente la veridicità in vari compiti, come ad esempio il miglioramento delle prestazioni dei modelli della famiglia LLaMA su TruthfulQA dal 12 al 17%, dimostrando il suo potenziale nel generare in modo affidabile fatti veritieri.
Oltre a migliorare la precisione fattuale, i ricercatori hanno scoperto che DoLa causa solo una piccola latenza aggiuntiva nel processo di decodifica, rendendolo una strategia pratica e utile per migliorare la veridicità dei LLM.
I risultati di questo studio rappresentano un importante passo avanti nel rendere i LLM più sicuri e affidabili. Tuttavia, i ricercatori riconoscono che ci sono ancora molte sfide da affrontare, come la comprensione completa delle ragioni per cui i LLM generano allucinazioni e come mitigare efficacemente questo problema. Nonostante queste sfide, il progresso rappresentato da DoLa è un passo significativo verso la creazione di LLM che possono generare informazioni accurate e affidabili.
Il paper si può leggere a questo link.