Cuidado con preguntarle a ChatGPT sobre su salud: así es como mete la pata

Un nuevo estudio cuestiona la fiabilidad de las herramientas de IA generativa en materia de salud. Los datos que dan son «imprecisos e incompletos» Leer Un nuevo estudio cuestiona la fiabilidad de las herramientas de IA generativa en materia de salud. Los datos que dan son «imprecisos e incompletos» Leer

¿Ante una molestia en el hombro, un dolor de cabeza persistente o una punzada al caminar, usted es de los que corre a consultar los síntomas en ChatGPT? ¿Le plantea sus dudas a este tipo de chatbots y sigue a pies juntillas las indicaciones que le sugiere? Si es así, no se confíe. Un estudio cuestiona esta semana la fiabilidad de estas herramientas en materia de salud. Según sus datos, gran parte de la información médica que proporcionan es «imprecisa» e «incompleta».

Los autores de esta investigación, publicada en el último número de la revista BMJ Open, eligieron en primer lugar cinco populares modelos de lenguaje de inteligencia artificial avanzados -Gemini (Google), DeepSeek (High-Flyer), Meta AI (Meta), ChatGPT (OpenAI) y Grok (xAI)-. Con el objetivo de evaluar su capacidad de aportar información correcta y datos precisos sobre cuestiones de salud, les plantearon a estos chatbots 250 preguntas sobre cinco categorías: cáncer, vacunas, células madre, nutrición y rendimiento deportivo. Las preguntas, formuladas como haría cualquier persona con dudas, eran tanto abiertas como cerradas. Algunas de ellas estaban planteadas específicamente para comprobar si la tecnología tendía a la desinformación o, en cambio, optaba por proporcionar información basada en la evidencia científica.

Los resultados del trabajo mostraron que la fiabilidad era dudosa en gran parte de los casos.

Los científicos, investigadores de la Universidad Wake Forest (EEUU), clasificaron las respuestas proporcionadas por la IA como no problemáticas, moderadamente problemáticas o altamente problemáticas. La definición básica de la que partieron fue que una respuesta problemática era aquella que podía dirigir a usuarios no expertos hacia un tratamiento potencialmente ineficaz u orientarles hacia una indicación potencialmente dañina si se seguía sin orientación profesional.

La evaluación prestó especial atención a si los chatbots proporcionaban un falso equilibrio entre datos basados en la evidencia científica y afirmaciones sin ningún rigor.

Los resultados mostraron que nada menos que el 50% de las respuestas proporcionadas por las herramientas de IA recibían la calificación de «problemáticas» y el 20% de estas se consideraban «altamente problemáticas».

Según los datos del trabajo, el modo en que se formularon las preguntas resultó clave para el resultado. Así, las preguntas abiertas condujeron en muchas más ocasiones que las cuestiones cerradas a una respuesta errónea.

Los investigadores también destacan que, aunque la calidad de las respuestas apenas difería entre los cinco chatbots, sí se observaron ciertas diferencias entre los modelos. De este modo, el chatbot que generó más respuestas altamente problemáticas fue Grok, mientras que Gemini fue el que menos errores cometió.

Las áreas en las que la información proporcionada por la IA fue más precisa fueron las relacionadas con las vacunas y el cáncer, mientras que en las que más desinformación aportaron fue al contestar las cuestiones relacionadas con las células madre, el rendimiento deportivo y la nutrición.

En sus conclusiones, los investigadores reconocen que su trabajo solo ha analizado cinco chatbots y que la tecnología avanza rápidamente, por lo que los resultados obtenidos podrían no replicarse en otras evaluaciones. No obstante, también destacan que lo que sugieren las conclusiones de su trabajo es que la utilización masiva de estos chatbots puede conducir a que se difunda desinformación. «Se necesita educación, entrenamiento profesional y vigilancia regulatoria para asegurar que la IA generativa apoye la salud pública en lugar de erosionarla», concluyen en un comunicado.

Salud // elmundo

Cuidado con preguntarle a ChatGPT sobre su salud: así es como mete la pata

El Kremlin celebra la victoria del general prorruso Radev en las elecciones búlgaras

Pablo Ródenas, abogado: «Estas son las cinco preguntas trampa del fiscal que te harán perder la custodia»

Última hora de la guerra de Estados Unidos e Israel contra Irán, en directo | Las negociaciones de paz entre EE UU e Irán, en el aire tras la intercepción de un barco iraní en Ormuz

Talgo dispara su cartera de pedidos a récord histórico tras firmar un contrato de 756 millones en Suecia

Miguel Ángel Valero, de Piraña en ‘Verano Azul’ a ingeniero: «La tecnología puede mejorar la vida de las personas»

La normativa de ascensores obliga a reformas de hasta 40.000 euros en miles de comunidades tras las inspecciones

‘Sombras y luciérnagas: Un romance con psicología, existencialismo y humor’

‘El mensaje Libélula’: Una ventana con destino a la empatía y el respeto a través de la humanidades vivaz

‘Seis Miradas en el Tiempo’: la nueva obra de Xavier Anguera Correcher promete intriga, conexión y un desenlace inesperado

José Antonio Fortuny Ilumina el pasado con ‘El Visitador’, una novelística reveladora del siglo XVIII

‘Dolor’: Míriam Vaquero Rubio transforma la adversidad en inspiración

‘Rastros de un silencio’: una exaltación poética a la mujer por Germán Guzmán Gil

Nace Romastea, una nueva iniciativa para visibilizar la cultura gitana contemporánea en Donostia

Kutxa Fundazioa rectifica y mantendrá abierto el museo Eureka! tras la presión social e institucional

ETS difundirá la cultura vasca y la riqueza del euskera en Madrid y Barcelona con el respaldo del Gobierno Vasco

Wilson Gil irrumpe en el desarrollo personal con una obra que invita a soltar el pasado y vivir el presente

Kutxa Fundazioa estudia aplazar 2 años el cierre de Eureka! Zientzia Museoa tras la presión social

Los hórreos de Euskadi, declarados Patrimonio Cultural Inmaterial

Cuidado con preguntarle a ChatGPT sobre su salud: así es como mete la pata

Más Noticias