L’articolo “Google AI has better bedside manner than human doctors — and makes better diagnoses” di Mariana Lenharo, pubblicato il 12 Gennaio 2024 su “Nature”, descrive una ricerca innovativa nel campo dell’intelligenza artificiale (AI) condotta da Google. L’oggetto della ricerca è un sistema di AI, basato su un modello avanzato di linguaggio (LLM), progettato per condurre interviste mediche. Questo chatbot AI, denominato Articulate Medical Intelligence Explorer (AMIE), è stato sviluppato per interagire con pazienti simulati, raccogliere la loro storia medica e fornire possibili diagnosi.
Il sistema è stato addestrato utilizzando dialoghi sia reali sia simulati, con lo scopo di imitare le interazioni tra medico e paziente. Per testare l’efficacia di AMIE, sono stati organizzati incontri online, basati su interazioni testuali, con attori formati per impersonare pazienti affetti da varie condizioni mediche. Questi incontri sono stati confrontati con quelli condotti da medici umani, valutando l’accuratezza delle diagnosi e la qualità della conversazione.
Uno dei principali limiti dello studio è che AMIE è stato testato solo con attori che simulavano condizioni mediche, non con veri pazienti. Pertanto, i risultati potrebbero non riflettere completamente l’efficacia del sistema in scenari clinici reali. Inoltre, lo studio non è ancora stato sottoposto a revisione paritaria, il che solleva domande sulla validità e l’affidabilità dei risultati.
Tra i punti negativi, oltre alla mancanza di esperienza con pazienti reali, vi è la necessità di un’approfondita valutazione dei potenziali bias. Sussistono preoccupazioni riguardanti la privacy e la sicurezza dei dati dei pazienti, e il metodo di interazione basato sul testo può differire significativamente dalle interazioni faccia a faccia tra medico e paziente.
Tra i punti di forza, AMIE ha dimostrato una maggiore precisione nella diagnosi di condizioni respiratorie e cardiovascolari rispetto ai medici umani. Ha inoltre mostrato un elevato livello di empatia nelle interazioni, suggerendo il potenziale per contribuire a democratizzare l’assistenza sanitaria, rendendo le diagnosi più accessibili.
In sintesi, l’articolo di Lenharo descrive una ricerca promettente che, nonostante i suoi limiti e la necessità di ulteriori studi e miglioramenti, potrebbe avere un impatto significativo sulla pratica medica e sull’accesso all’assistenza sanitaria.
A commento generale si potrebbe aggiungere che, se da un lato è vero che nelle fasi iniziali di ricerca è comune utilizzare scenari controllati e simulati nei test preliminari, dall’altro lato, la mancanza di interazione con veri pazienti in un ambiente clinico autentico può rappresentare un deficit metodologico non trascurabile. Questo approccio potrebbe infatti limitare la comprensione della vera efficacia e affidabilità del sistema in situazioni reali.