Científicos del Laboratorio Europeo de Biología Molecular (EMBL) y del Centro Alemán de Investigación Oncológica (DKFZ) han creado un modelo de IA generativa capaz de estudiar historiales médicos a gran escala y estimar cómo evoluciona la salud humana a lo largo del tiempo.
El sistema predice tanto el riesgo como el momento más probable de aparición de más de mil enfermedades. Para entrenarlo, se usaron datos anónimos de más de 400 000 pacientes del UK Biobank, y se pudo validar gracias a información de 1,9 millones de personas del Registro Nacional de Pacientes Daneses.
De acuerdo con sus desarrolladores, es una de las demostraciones empíricas más completas hasta la fecha de cómo la IA generativa puede predecir la progresión de enfermedades humanas en diferentes sistemas sanitarios.
"Nuestro modelo de IA es una prueba de concepto: demuestra que es posible aprender de nuestros patrones de salud a largo plazo y usar esta información para generar predicciones valiosas", dice Ewan Birney, director general interino del EMBL.
Planificar intervenciones preventivas
"Si modelamos cómo se desarrollan las enfermedades a lo largo del tiempo, podemos empezar a explorar cuándo empiezan a emerger ciertos riesgos y esto nos permite planificar intervenciones preventivas. Es un gran paso hacia un sistema de salud personalizado y hacia la medicina preventiva", afirma Birney.
Publicado en 'Nature', el trabajo es obra de la colaboración entre el EMBL, el DKFZ y la Universidad de Copenhague. Esta IA se basa en principios muy parecidos a los de los modelos de lenguaje a gran escala (LLM, por sus siglas en inglés), y estudia la 'gramática' de los datos de salud para representar los historiales médicos en plan secuencias de eventos, diagnósticos o factores de estilo de vida como el tabaquismo, que pasan en un orden determinado y con intervalos temporales entre ellos.
"Los eventos médicos a menudo siguen patrones predecibles", indica Tom Fitzgerald, investigador del EMBL. "Nuestro modelo de IA aprende esos patrones y puede predecir resultados de salud. Nos proporciona una vía para explorar lo que podría pasarle a una persona basándose en su historial médico y otros factores clave. Obviamente la predicción no es una certeza, sino una estimación de los riesgos potenciales".
Estimación de riesgos
El sistema es especialmente acertado en enfermedades con patrones de desarrollo consistentes, como serían ciertos tipos de cáncer, infartos o sepsis. Como pasa con las predicciones meteorológicas, lo que da son probabilidades, no certezas. Por ejemplo, puede calcular el riesgo de desarrollar una enfermedad cardiovascular en el próximo año, y lo saca como tasas a lo largo del tiempo, parecido a prever un 70 % de probabilidad de lluvia.
Ciertos eventos, como el riesgo de hospitalización por un infarto, se pueden prever con mayor precisión, mientras que otros son mucho más difíciles de diagnosticar. Las predicciones a corto plazo son más fiables que las de largo alcance. En los campos del UK Biobank entre 50 y 55 años, el riesgo de infarto varía desde una probabilidad de 1 en 10 000 por año hasta 1 en 100, de acuerdo a diagnósticos previos y estilo de vida. Las mujeres cuentan con un riesgo medio menor, pero con una distribución similar.
En general, la probabilidad se incrementa con la edad. Una evaluación sistemática dejó ver que los riesgos calculados del modelo se corresponden bien con los casos observados.