Lo que The Pitt acierta y se equivoca sobre la IA generativa en medicina
La serie de Pittsburgh retrata con sorprendente precisión el uso clínico de esta tecnología, pero esquiva dilemas clave: desde los verdaderos márgenes de error hasta los cambios que se vienen en la relación entre médicos, pacientes y máquinas.

Como médico y exdirector ejecutivo de un importante grupo médico, muchas veces me preguntan qué tan realistas son los dramas médicos que vemos en televisión. ¿Qué aciertan? ¿Qué se distorsiona para contar una historia?

Las respuestas, claro, dependen del programa y del tema en cuestión. Por eso presté especial atención cuando The Pittuna serie ganadora de varios premios Emmy ambientada en un servicio de urgencias ficticio de Pittsburgh— decidió enfocarse en el uso de la inteligencia artificial generativa en medicina, un tema que sigo de cerca desde hace tres años.

En ese sentido, hay que reconocerles el mérito a los guionistas: el segundo capítulo de la segunda temporada ("8:00 AM") evita caer en representaciones exageradas o visiones distópicas. En cambio, muestra la IA generativa tal como se utiliza hoy en la práctica clínica: como una herramienta pensada para ahorrar tiempo, reducir errores y mejorar la atención médica.

Aunque el capítulo acierta en varios aspectos importantes, también comete errores y deja afuera una de las partes más interesantes de la inteligencia artificial generativa.

La inteligencia artificial llega a Pitt

Como ocurre en la mayoría de los dramas médicos, la historia gira en torno a un conflicto entre dos personajes. El Dr. Michael "Robby" Robinavitch (Noah Wyle), un médico de urgencias con años de experiencia y protagonista de la serie, defiende el valor de la intuición humana, forjada a lo largo de su carrera. En cambio, el Dr. Baran Al-Hashimi (Sepideh Moafi), quien lo reemplaza de manera temporal, impulsa el uso de herramientas asistidas por IA para mejorar la eficiencia y la atención a los pacientes.

@@FIGURE@@

Presenta al equipo una herramienta de IA generativa que escucha lo que cuentan los pacientes y redacta automáticamente las notas del historial médico electrónico. En la práctica clínica real, estas utilidades se conocen como "escritores de IA ambiental".

Los residentes se sorprenden por la cantidad de tiempo que se puede ahorrar. Pero enseguida llega el momento en que sube la tensión en el capítulo: la IA confunde un medicamento con otro de nombre parecido, aunque con un uso completamente distinto. El error lo detecta un médico humano.

Un residente hace un chiste y dice que IA significa "casi inteligente". Al-Hashimi le responde que el sistema tiene una precisión del 98 %, y aclara que sus recomendaciones deben revisarse con atención porque la tecnología es "excelente, pero no perfecta".

La escena es breve. El error se corrige y ningún paciente sale herido. Pero el capítulo deja tres preguntas abiertas.

1. ¿En qué acertó Pitt sobre la IA en medicina?

El escepticismo del Dr. Robinavitch y el entusiasmo del Dr. Al-Hashimi reflejan una división que crece dentro de la medicina actual.

Desde lo estadístico, el personaje de Moafi representa a cerca de dos tercios de los médicos que hoy usan herramientas de IA generativa para acceder o gestionar información médica de sus pacientes. En cambio, el personaje de Wyle encarna al tercio que todavía prioriza los métodos tradicionales, porque sus dudas superan el entusiasmo por esta tecnología.

Esa cautela surge de dos miedos principales. El primero es el miedo al daño: que un sistema de IA cometa un error que lastime a un paciente. El segundo, más profundo, es el miedo a quedar desplazados: que estas herramientas, al perfeccionarse, debiliten el criterio profesional y le resten peso a la autoridad humana. Son miedos racionales, y hoy forman parte de las discusiones dentro del sistema de salud. @@FIGURE@@

La serie también acierta al mostrar cómo se implementa la IA en los hospitales. En todo el país, su uso se concentró en tareas administrativas: escuchar lo que dicen los pacientes, redactar notas para el historial médico electrónico, resumir historias clínicas y colaborar con la facturación y la codificación.

Hasta ahora, la IA generativa casi no se usó para mejorar de forma directa los resultados clínicos. Los hospitales y sistemas de salud todavía muestran reservas a la hora de aplicar esta tecnología para contrastar diagnósticos, detectar posibles errores médicos o ayudar a los pacientes a controlar mejor enfermedades crónicas.

Una excepción importante empezó a tomar forma en Utah. Allí, los reguladores aprobaron un programa piloto que permite que un sistema basado en IA renueve recetas para pacientes con enfermedades crónicas sin supervisión médica directa. Lo que ocurra con este experimento será clave, sobre todo si intervienen las autoridades federales. La gran incógnita es si la Administración de Alimentos y Medicamentos (FDA) clasificará estos sistemas como dispositivos médicos regulados o si los considerará herramientas de atención médica sujetas, principalmente, a regulación estatal.

Más allá del rumbo que elijan los hospitales en adelante, The Pitt acierta en lo esencial: la IA generativa en medicina no se adopta porque sea perfecta, ni se descarta porque no sirva. Lo que retrasa su incorporación es la cautela.

2. ¿En qué se equivocó el capítulo?

Cuando la Dra. Al-Hashimi les dice a sus colegas que el sistema de IA tiene una precisión del 98 %, la cifra suena sólida y confiable. Pero, aunque está formulada para sonar tranquilizadora, también es profundamente engañosa. Sin contexto, no significa nada.

Si ese 98 % quiere decir que, al revisar 100 historiales médicos, se detectan dos con algún error, entonces la cifra minimiza el problema. Los errores menores son habituales en la documentación clínica, sobre todo en salas de urgencias, donde el ruido y la presión son constantes. Ahora bien, si ese 98 % implica que 1 de cada 50 pacientes podría sufrir un daño serio por un error de la IA generativa, entonces el capítulo exagera brutalmente el riesgo. @@FIGURE@@

Distintos estudios muestran que los errores humanos en los historiales médicos electrónicos son frecuentes. Al menos la mitad contiene al menos un error. Cuando los propios pacientes revisan su historial, cerca de 1 de cada 5 detecta fallas. Van desde simples errores de transcripción hasta datos incorrectos sobre medicamentos, antecedentes médicos o diagnósticos actuales. Muchos de estos errores surgen por descuidos menores de profesionales que trabajan bajo presión, y se corrigen en consultas posteriores. Sin embargo, los más graves suelen tener un origen común: la práctica extendida de copiar y pegar notas previas en nuevas entradas. Eso hace que las imprecisiones se mantengan y, con el tiempo, se vuelvan más problemáticas. @@FIGURE@@

Al capítulo también le faltó un dato clave: el error médico ya es la tercera causa de muerte en Estados Unidos. Según distintas investigaciones, hasta 400.000 personas mueren cada año por diagnósticos equivocados, y otras 400.000 sufren discapacidades permanentes.

Si se lo mira con objetividad, incorporar IA generativa en la práctica clínica podría ser beneficioso para los pacientes. Pero no será fácil que la sociedad lo acepte. Los psicólogos conductuales advierten que, muchas veces, las personas toleran los errores humanos, pero reaccionan con mucha más dureza frente a fallas similares cometidas por máquinas, incluso cuando la tecnología tiene mejor rendimiento. A ese fenómeno lo llaman aversión a los algoritmos.

3. ¿Qué fue lo que el programa omitió por completo?

The Pitt no falla al mostrar cómo se usa hoy la IA en medicina. Lo que deja afuera es algo más importante: hacia dónde probablemente se encamina esta tecnología.

En los próximos años, la IA generativa no se limitará a la documentación o al apoyo en la toma de decisiones. Va a asumir un rol clínico más autónomo, sobre todo en áreas donde la medicina tiene dificultades para lograr resultados consistentes. El tratamiento de enfermedades crónicas es un ejemplo claro. Hoy, pacientes con afecciones como hipertensión o diabetes suelen ir al médico tres o cuatro veces al año, y los ajustes en el tratamiento se hacen a partir de análisis breves de su estado de salud. Con ese esquema, cualquier cambio relevante en la evolución de la enfermedad puede pasar desapercibido durante meses.

En cambio, las herramientas de IA generativa pronto permitirán un monitoreo continuo y ajustes más frecuentes en la medicación. Podrán conectarse con tensiómetros, medidores de glucosa y relojes inteligentes. En lugar de esperar a una consulta programada o a una crisis aguda, estos sistemas van a detectar a tiempo el deterioro o la falta de control en enfermedades crónicas, lo que permitirá intervenir de forma oportuna. Hoy, la hipertensión está controlada en apenas la mitad de los pacientes a nivel nacional. Con monitoreo constante e intervenciones tempranas, se podrían alcanzar tasas de control superiores al 90 %.

A medida que la IA asuma un rol más activo en el seguimiento rutinario y en la optimización de tratamientos, los médicos podrán concentrarse en quienes más los necesitan: pacientes con enfermedades complejas o poco frecuentes, que requieren criterio clínico, experiencia y empatía.

Ese tipo de colaboración entre humanos y tecnología resolverá muchas de las tensiones que The Pitt plantea en este episodio. Pero también abrirá la puerta a otras nuevas que los guionistas podrían explorar: se modificarán funciones y jerarquías tradicionales dentro de la medicina. Algunos trabajos desaparecerán o cambiarán de manera profunda. Y habrá situaciones en las que médicos y sistemas de IA generativa no coincidan en un diagnóstico, en un plan de tratamiento o en cómo actuar frente al final de la vida.

Más allá de cómo los dramas médicos decidan retratar esta transformación, en la práctica clínica hay algo que empieza a quedar claro: la combinación de médicos comprometidos, pacientes con mayor participación e inteligencia artificial generativa logrará mejores resultados que cualquiera de los tres actuando por separado.

Este artículo fue publicado originalmente por Forbes.com