I chatbot sanno davvero fare diagnosi corrette? / Can chatbots really make accurate diagnoses?

in Italy28 days ago

Source


Secondo uno studio pubblicato su JAMA Network Open, se è vero che l'IA se la cava piuttosto bene a formulare diagnosi quando ha tutte le informazioni necessarie, non è per nulla affidabile nella fase iniziale con pochi dati alla mano.

I ricercatori hanno chiesto a 21 LLM, tra cui ChatGPT, DeepSeek, Claude, Gemini e Grok, di fingersi medici in 29 scenari clinici.

I chatbot si rivelavano medici validi in oltre il 90% dei casi quando venivano fornite loro tutte le informazioni utili contemporaneamente.

Faticavano invece nelle fasi preliminari del processo diagnostico, quelle nelle quali bisogna redigere una lista di diagnosi differenziali da verificare, non sono in grado di arrivare a diagnosi differenziali corrette in oltre l'80% dei casi.

Le diagnosi differenziali sono centrali nel ragionamento clinico e sono alla base della medicina, che l'intelligenza artificiale non è ancora in grado di replicare.


Leggi l'articolo completo di seguito:


Riferimenti:







. . . . . . . . . .


Mi piace utilizzare questo spazio su steemlinks per condividere gli articoli che ritengo utili e interessanti e che provengono da fonti attendibili.

. . . . . . . . . .


ENGLISH VERSION


Source


According to a study published in JAMA Network Open, while AI is quite good at making diagnoses when it has all the necessary information, it is not at all reliable in the initial phase with little data.

The researchers asked 21 LLMs, including ChatGPT, DeepSeek, Claude, Gemini, and Grok, to pose as doctors in 29 clinical scenarios.

The chatbots proved to be effective doctors in over 90% of cases when they were provided with all the relevant information at once.

However, they struggled in the preliminary phases of the diagnostic process, where a list of differential diagnoses must be compiled and verified; they were unable to arrive at correct differential diagnoses in over 80% of cases.

Differential diagnoses are central to clinical reasoning and are the foundation of medicine, which artificial intelligence is not yet able to replicate.


Read the full article below:


References:







. . . . . . . . . .


I like using this space on steemlinks to share articles I find useful and interesting, especially when they come from reliable sources.

. . . . . . . . . .



Progetto senza titolo (10).jpg


Aggiungi un sottotitolo.gif
High Quality Curation.


Progetto senza titolo (10).jpg

NON PERDERTI IL NUOVO GIOCO SULLA BLOCKCHAIN DI STEEMMiniature di YouTube 1280x720 px(1).gif



Progetto senza titolo (10).jpg


I'm part of ITALYGAME Team with: @girolamomarotta, @sardrt, @mad-runner, @frafiomatale, @famigliacurione



Progetto senza titolo (10).jpg


Sort:  

Upvoted! Thank you for supporting witness @jswit.

This post has been upvoted by @italygame witness curation trail


If you like our work and want to support us, please consider to approve our witness




CLICK HERE 👇

Come and visit Italy Community