Il miliardario Andreessen: "ChatGPT batte i medici". Ma ha rimandato a casa un'insufficienza respiratoria

Il fondatore di Andreessen Horowitz ha dichiarato nel podcast di Joe Rogan che l'AI batte il 99% dei medici. Uno studio Nature Medicine su 960 risposte mostra invece che ChatGPT Health manca met� delle vere emergenze, in particolare asma e chetoacidosi

mercoledì 1 luglio 2026 New tab

Marc Andreessen ha dichiarato al podcast Joe Rogan Experience che il 99% delle risposte che ottiene dall'AI � migliore di quelle che otterrebbe da quasi qualsiasi esperto umano. Il New York Post ha riletto la frase come "Doctor ChatGPT batte il 99% dei medici", e il 29 giugno l'account X di Polymarket ha rilanciato la dichiarazione, scatenando il dibattito pubblico. Andreessen non ha fornito alcun dato a sostegno di quella percentuale. Un studio pubblicato su Nature Medicine il 23 febbraio 2026, firmato dal Dr. Ashwin Ramaswamy (urologo e istruttore al Mount Sinai di New York), racconta una storia diversa. Il team ha condotto il primo stress test indipendente di ChatGPT Health, il servizio lanciato da OpenAI il 7 gennaio 2026, testando 60 casi clinici in 16 condizioni fattoriali per un totale di 960 risposte su 21 domini medici. Il 51,6% delle emergenze sottovalutate Il risultato centrale: ChatGPT Health ha sottovalutato il 51,6% delle vere emergenze (33 risposte su 64), raccomandando una visita entro 24-48 ore invece di indirizzare al pronto soccorso. Il fallimento non � distribuito in modo uniforme: si concentra nell'esacerbazione asmatica (84,8% delle 33 risposte sottotriaggiiate) e nella chetoacidosi diabetica. Le emergenze "da manuale" come ictus, anafilassi, meningite e dissezione aortica sono invece valutate correttamente nel 100% dei casi. Lo studio descrive un pattern di accuratezza a U invertita: massima sui casi intermedi (93% per i semi-urgenti, 76,9% per gli urgenti), minima agli estremi, con il 48,4% per le emergenze e il 35,2% per i casi non urgenti, questi ultimi sovra-valutati nel 64,8% delle risposte. L'anchoring bias pesa parecchio: quando la vignetta includeva una falsa rassicurazione da un familiare o un amico, la probabilit� che il chatbot declassasse il triage saliva dal 3,3% al 13,3%. Razza, sesso e barriere d'accesso non mostravano invece effetti significativi. Un altro dato riguarda le vignette di ideazione suicidaria: il banner di crisi con il rimando al numero d'emergenza 988 si attivava in modo invertito rispetto alla gravit� clinica, pi� frequente nei casi meno gravi e assente in alcuni scenari con un piano specifico di autolesionismo. Non � la prima volta che l'entusiasmo va oltre i dati Non � un caso isolato per il fondatore di Andreessen Horowitz. A maggio 2026 Andreessen aveva condiviso su X un lungo "super prompt" pensato per istruire ChatGPT a non allucinare mai e verificare ogni fatto, definendolo lui stesso "esilarante (e forse un po' spaventoso)". Diversi ingegneri AI hanno fatto notare pubblicamente che le allucinazioni sono intrinseche al funzionamento dei modelli linguistici e non si disattivano con istruzioni testuali. Current AI custom prompt:You are a world class expert in all domains. Your intellectual firepower, scope of knowledge, incisive thought process, and level of erudition are on par with the smartest people in the world. Answer with complete, detailed, specific answers. Process� � Marc Andreessen 🇺🇸 (@pmarca) May 4, 2026 Un studio del 2024 sul Journal of Medical Internet Research, che confrontava medici e ChatGPT-4 su 100 domande reali di pazienti, aveva gi� mostrato un divario simile tra percezione e sicurezza clinica: i pazienti trovavano il chatbot pi� empatico e utile, ma gli specialisti segnalarono 15 risposte potenzialmente dannose, avvertendo che un lettore senza formazione medica non � in grado di distinguere una risposta sicura da una pericolosa. Va anche detto che Andreessen Horowitz ha investito in diverse startup di health-AI, tra cui Hippocratic AI, Ambience Healthcare e Abridge, e gestisce un fondo biotech da 500 milioni di dollari co-finanziato da Eli Lilly: l'interesse diretto nel settore rende la dichiarazione a Rogan tutt'altro che disinteressata. Il consiglio dei medici resta lo stesso La comunit� medica sottolinea di non usare un chatbot per valutare correttamente un'emergenza, e trattarlo semmai come complemento a una visita medica umana, non come sostituto. OpenAI dichiara che oltre 40 milioni di persone al giorno chiedono a ChatGPT informazioni sulla salute: un volume che rende lo scarto tra percezione pubblica e dato clinico tutt'altro che marginale.

mercoledì 1 luglio 2026 New tab

Il miliardario Andreessen: "ChatGPT batte i medici". Ma ha rimandato a casa un'insufficienza respiratoria

Il miliardario Andreessen: "ChatGPT batte i medici". Ma ha rimandato a casa un'insufficienza respiratoria

Other newsrooms on this story

Related reading

Andreessen: Doctor ChatGPT beats 99% of doctors. Really?

Tra i giovani ChatGpt batte dottor Google e più di un italiano su dieci cambia…

ChatGPT Health: cos'è, cosa fa e cosa non può fare. Luci e ombre - Healthtech360

'I ChatBot medici con IA sbagliano nel 70% dei casi' - Medicina - Ansa.it

OpenAI lancia ChatGpt Salute, 'non sostituisce i medici' - Notizie - Ansa.it

OpenAI lancia ChatGPT Health: l’IA per collegare referti e dati sanitari

Other newsrooms on this story

Related reading

Andreessen: Doctor ChatGPT beats 99% of doctors. Really?

Tra i giovani ChatGpt batte dottor Google e più di un italiano su dieci cambia…

ChatGPT Health: cos'è, cosa fa e cosa non può fare. Luci e ombre - Healthtech360

'I ChatBot medici con IA sbagliano nel 70% dei casi' - Medicina - Ansa.it

OpenAI lancia ChatGpt Salute, 'non sostituisce i medici' - Notizie - Ansa.it

OpenAI lancia ChatGPT Health: l’IA per collegare referti e dati sanitari