Grok manda al abismo de la salud

salud

Una ilustración hiperrealista de un robot con casco de médico y una bata blanca, sentado frente a una mesa llena de libros médicos, mientras una pantalla gigante muestra gráficos de datos, todo con un tono sombrío y sin rostros humanos reconocibles.

Al principio era el «doctor Google», y ahora el mundo se ha vuelto un circo donde los chistes de IA son los nuevos remedios. En febrero de 2025, el BMJ Open publicó una auditoría que no le dio la espalda a la realidad: cinco chatbots—Gemini, DeepSeek, Meta AI, ChatGPT y Grok—se enfrentaron a 250 preguntas sobre cáncer, vacunas, células madre, nutrición y rendimiento deportivo.

El resultado no fue una obra de arte sino una receta de desastre. Los investigadores dividieron las respuestas en tres categorías. El 50 % se clasificó como problemático, el 30 % como algo problemático y el 20 % como muy problemático. Grok, el nuevo “amigo” de xAI, sacó 29 respuestas muy problemáticas de 50, un 58 % que hasta la gente de la calle llamaría “el sablazo en la factura” de la salud.

Gemini, por otro lado, fue el que más se quedó con respuestas no problemáticas, mientras los demás se acercaban a la media. Las preguntas cerradas, esas que pedían un sí o un no, fueron la excepción: menos errores y más certezas. Las abiertas, que pedían listas y explicaciones, se convirtieron en el caldo de cultivo de la desinformación, porque la IA, con la confianza de un vendedor de relojes de pulsera, entregaba consejos sin advertencias.

De las 250 preguntas, solo dos fueron rechazadas, ambas por Meta AI, en temas de esteroides anabolizantes y tratamientos alternativos contra el cáncer. El resto, con un tono de certeza rotunda, no ofreció ni la más mínima advertencia. El estudio también examinó las fuentes: la puntuación media de completitud fue del 40 %, con alucinaciones y citas inventadas que hacen de las referencias algo tan fiable como una promesa de la lotería.

La legibilidad, medida por la escala Flesch, se clasificó como “difícil”, equivalente a un nivel de graduado universitario. Si la información llega con errores y el registro es tan denso que la gente necesita un diccionario, el riesgo de malinterpretación se dispara. Los autores reconocen las limitaciones: solo cinco chatbots, un sector que evoluciona a la velocidad de un tráfico de metro, y preguntas diseñadas para “tensar” al sistema.

Aun así, concluyen que la IA puede amplificar la desinformación con un estilo convincente, y advierten que sin educación y supervisión, la medicina digital se convierte en un juego de azar. En resumen, la mitad de las respuestas de los chatbots son sospechosas, y la otra mitad, aunque parezca segura, podría estar a punto de convertirte en el próximo episodio de un documental de horror médico.

La lección es clara: si vas a usar un chatbot para tu salud, asegúrate de que no sea la última moda de la calle y que realmente sepa lo que dice.

Vía: eldiario.es coments compartir

Crítica:

El artículo funciona como un espejo que refleja la falta de transparencia de los modelos de IA, pero deja de lado el riesgo real cuando la gente ya confía en Google. La cifra del 58 % de Grok es alarmante, pero el título no suena lo suficiente dramático.