Un modelo de inteligencia artificial (IA) llamado Delphi-2M, presentado este miércoles en la revista Nature, es capaz de predecir el riesgo y los resultados de salud con más de una década de antelación. La herramienta, según sus creadores, se basa en datos de hasta 20 años del historial médico del paciente y tiene una precisión superior a la de tecnologías existentes.
Este nuevo modelo de IA generativa se diseñó a medida utilizando conceptos algorítmicos similares a los empleados en los modelos de lenguaje extenso (LLM), como el conocido ChatGPT. El sistema se entrenó con datos anónimos de pacientes de 400.000 participantes del Biobanco del Reino Unido y se probó usando datos de casi dos millones de personas en Dinamarca.
El modelo funciona especialmente bien en afecciones con patrones de progresión claros y consistentes, como ciertos tipos de cáncer, infartos y septicemia (infección en la sangre). Sin embargo, el modelo es menos fiable en afecciones más variables, como trastornos de salud mental o complicaciones relacionadas con el embarazo que dependen de eventos vitales impredecibles.
Al modelar la evolución de las enfermedades a lo largo del tiempo, podemos empezar a explorar cuándo surgen ciertos riesgos y cómo planificar mejor las intervenciones tempranas
“Nuestro modelo es una prueba de concepto que demuestra que la IA puede aprender mucho de nuestros patrones de salud a largo plazo y utilizar esta información para generar predicciones significativas”, asegura Ewan Birney, director ejecutivo interino del Laboratorio Europeo de Biología Molecular (EMBL). “Al modelar la evolución de las enfermedades a lo largo del tiempo, podemos empezar a explorar cuándo surgen ciertos riesgos y cómo planificar mejor las intervenciones tempranas. Es un gran paso hacia enfoques más personalizados y preventivos de la atención médica”.
Así como los modelos de lenguaje extensos pueden aprender la estructura de las oraciones, este modelo de IA aprende la gramática de los datos de salud para modelar los historiales médicos como secuencias de eventos que se desarrollan a lo largo del tiempo. Estos eventos incluyen diagnósticos médicos o factores de estilo de vida como el tabaquismo. El modelo aprende a predecir el riesgo de enfermedad a partir del orden en que ocurren dichos eventos y el tiempo transcurrido entre ellos.
Nuestro modelo de IA nos permite explorar qué podría suceder con base en el historial médico de una persona y otros factores clave
“Los eventos médicos suelen seguir patrones predecibles”, afirma Tom Fitzgerald, científico del Instituto Europeo de Bioinformática del EMBL (EMBL-EBI). “Nuestro modelo de IA aprende esos patrones y puede predecir futuros resultados de salud. Nos permite explorar qué podría suceder con base en el historial médico de una persona y otros factores clave”.
Sesgos y limitaciones
Los creadores advierten de que, al igual que los pronósticos meteorológicos, este nuevo modelo de IA proporciona probabilidades, no certezas. No predice con exactitud qué le sucederá a una persona, pero ofrece estimaciones bien calibradas de la probabilidad de que ciertas afecciones se presenten en un período determinado. Por ejemplo, podría predecir la probabilidad de desarrollar una enfermedad cardíaca durante el próximo año.
Estos riesgos se expresan como tasas a lo largo del tiempo, similar a pronosticar un 70% de probabilidad de lluvia mañana. Generalmente, los pronósticos a corto plazo tienen mayor precisión que los de largo plazo.
El modelo también presenta sesgos demográficos, al estar calibrado para generar estimaciones precisas de riesgo a nivel poblacional, pronosticando la frecuencia con la que ciertas afecciones se presentan en grupos de personas. Como los datos provienen principalmente de personas de entre 40 y 60 años, los eventos de salud infantil y adolescente están subrepresentados. Además, debido a la falta de datos de entrenamiento, incluyendo la subrepresentación de ciertos grupos étnicos.
El reto inmediato para la asistencia sanitaria es garantizar que exista una infraestructura digital y una base de competencias suficientes para todos, independientemente de su origen socioeconómico
Si bien el modelo no está listo para su uso clínico, los autores del trabajo creen que podría ayudar a los investigadores a comprender cómo se desarrollan y progresan las enfermedades con el tiempo, explorar cómo el estilo de vida y las enfermedades pasadas afectan el riesgo de enfermedad a largo plazo y a simular resultados de salud utilizando datos artificiales de pacientes, en situaciones donde los datos del mundo real son difíciles de obtener o acceder.
Respecto a la privacidad, este modelo de IA se entrenó con datos de salud anónimos bajo estrictas normas éticas. Los participantes del Biobanco del Reino Unido dieron su consentimiento informado, y se accedió a los datos daneses de acuerdo con la normativa nacional que exige que permanezcan en Dinamarca. Los investigadores utilizaron sistemas virtuales seguros para analizar los datos sin trasladarlos a otros países. Estas medidas de seguridad ayudan a garantizar que los modelos de IA se desarrollen y utilicen respetando la privacidad y los estándares éticos.
Evitar la desigualdad
Gustavo Sudre, profesor de Neuroimagen Genómica e Inteligencia Artificial en el King's College de Londres, considera que esta investigación parece ser un paso significativo hacia una forma de modelización predictiva en medicina que sea escalable, interpretable y, lo que es más importante, éticamente responsable. “La demostración clara de cómo se puede utilizar la IA explicable para modelizar predicciones es crucial si se quiere utilizar esta tecnología en la práctica clínica y sugiere que podría ser posible identificar a las personas de alto riesgo que necesitan intervención”, explica al Science Media Centre en Reino Unido.
Peter Bannister, experto en atención sanitaria y miembro de la Institution of Engineering and Technology (Reino Unido), cree que aún queda mucho camino por recorrer para mejorar la atención sanitaria, ya que los autores reconocen que ambos conjuntos de datos presentan sesgos en cuanto a edad, origen étnico y resultados sanitarios actuales. “El reto inmediato para la asistencia sanitaria es garantizar que exista una infraestructura digital y una base de competencias suficientes para todos, independientemente de su origen socioeconómico, de modo que las tecnologías actualmente disponibles puedan ofrecerse a quienes más necesitan mejorar su acceso a los tratamientos”, concluye.