Adrián Belso Garzas. Lead Data Scientist en FutuRS
Gracias a matemáticos como Adrián, que trabajan para mejorar la salud de los ciudadanos, el grupo Ribera ha desarrollado tres modelos predictivos para anticipar decisiones clínicas de los profesionales sanitarios: heridas por presión, caídas e ingresos en UCI por Covid. Ahora está trabajando en un modelo sobre las probabilidades de reingreso de pacientes en 30 días y en otro aún más complejo, puesto que analizará imágenes. “En un hospital te das cuenta enseguida de la utilidad de lo que haces y del valor que tiene tu trabajo, porque la salud es algo real y tangible”, asegura, tras reconocer que no se aburre nunca y que los retos son constantes. “Las posibilidades son infinitas”, añade con pasión. Adrián sabe que su trabajo está cambiando ya la vida de miles de pacientes. “Y cuando un enfermero o un médico te dice que lo que haces es muy útil, que les ha servido mucho, resulta muy satisfactorio”.
Adrián Belso, lead data scientist en futurs, la filial tecnológica del grupo sanitario Ribera, es matemático, tiene 28 años y empezó en Ribera como becario de sistemas de la información; después lo contrataron como business intelligence developer y al cabo de un año ascendió a lead data scientist, ya como parte de futuRS. Dentro del equipo de Cynara Care, la historia clínica modulable de Ribera, Adrián Belso participa en el desarrollo de los modelos predictivos que ha implementado el grupo en sus distintos hospitales y centros de salud, dando respuesta a las necesidades de profesionales y pacientes mediante el procesado inteligente de datos clínicos. El caso de Adrián ilustra perfectamente la impactante aportación de los jóvenes profesionales de la tecnología al profundo cambio cultural que veníamos experimentando y que la pandemia ha acelerado: la digitalización de nuestro mundo ya está aquí, y mejora nuestras vidas.
Adrián quería ser profesor de Matemáticas, pero se lo cuestionó al darse cuenta de que ya sabía en qué consistía la Educación. La curiosidad le llevó a interesarse por otras salidas y recaló en el germen de lo que después sería futuRS, es decir, los servicios B2B que diferentes equipos técnicos desarrollaban en los hospitales de Ribera.
¿Cómo expondrías de forma sencilla las ventajas o el interés que tiene trabajar en el sector de la salud a estudiantes que estén ahora cursando Matemáticas y se interesen por la ciencia de datos?
R. En Matemáticas es todo muy teórico. Todos nos preguntamos en algún momento para qué vale lo que aprendemos; las matemáticas son preciosas, pero ¿a dónde me van a llevar? La salud es algo real y tangible. En un hospital te das cuenta enseguida de la utilidad de lo que haces.
¿Hay en tu generación una visión más aspiracional que en otras en lo que se refiere al trabajo?
Creo que sí. En mi carrera éramos pocos y nos relacionábamos gente de todos los cursos. Notabas que los mayores se orientaban más hacia la educación, los doctorados y la vida académica. A nosotros eso nos gustaba, pero queríamos investigar otras zonas y aplicaciones del conocimiento. Ahora la tendencia es ir hacia la empresa, y no solo por el salario. Para mi gusto, lo que se hace en concreto en el sector de la salud es apasionante.
¿Están los estudiantes suficientemente orientados, alguien les cuenta lo que se pueden encontrar?
Mis profesores me contaban que antes los bancos acudían a los últimos cursos de la universidad a reclutar matemáticos en ciernes, que salían de allí ya con trabajo. Cuando yo estudié no vino nadie, pero se programaban jornadas para que las compañías pusieran stands donde explicaban qué hacían y lo que necesitaban; Ribera Salud, también. Estaría bien que se sistematizase algo así al final de las carreras. Yo he impartido clases en un máster y también algún curso de verano de la Universidad de Alicante y los alumnos mostraban interés por lo que dije allí. Una de ellas está trabajando ahora con nosotros.
Además de los tres modelos predictivos grandes que habéis desarrollado hasta ahora con Cynara Care (heridas por presión, caídas y probabilidad de UCI por COVID-19), ¿habéis abordado ya alguno más?
No de ese tamaño, pero estoy ahora ayudando a montar un trabajo de fin de grado, un modelo predictivo a pequeña escala sobre probabilidad de reingreso de pacientes en 30 días. Ya veremos si nos sirve más adelante. También tenemos en el horizonte un proyecto muy grande que trata con imágenes. No se procesa igual; son millones de píxeles, hay que estudiar cada píxel, y eso son palabras mayores. Es un paso muy grande; pero lo queremos dar, porque creemos que va a ayudar muchísimo a los médicos a la hora de tomar decisiones.
Vosotros diseñáis vuestros propios algoritmos, que tienen mucho que ver con cómo funcionan los procesos de análisis de datos. ¿Cómo os “inventáis” eso?
Primero leemos la literatura científica que haya; esto lo hacen sobre todo los miembros del equipo que tienen formación sanitaria. Me entregan un “excel” con esas primeras variables, y nos reunimos para discutir las dos fases del modelo predictivo: la retrospectiva y la prospectiva. En la retrospectiva decidimos qué periodo de tiempo utilizamos para esos pacientes, desde cuándo metemos los datos. Para el modelo de la Covid, como empezamos en junio y no había muchos datos, escogimos los que había, que iban de marzo a junio. Una vez escogido el periodo hay que decidir en qué momento del ingreso sacamos las variables: ¿justo cuando ingresa, cuando se va de alta, en la mediana del ingreso, antes de irse a UCI? Al principio era una discusión trabajosa; ahora ya está más encaminada.
En los hospitales ingresan pacientes de Covid que empeoran a toda velocidad, otros que tienen ingresos larguísimos…
Claro, por eso la discusión es tan ardua y nos cuesta tanto decidir. En un momento dado nos damos cuenta de que con las cepas nuevas entra otra variable fundamental. O con la vacuna; en el hospital están ya comprobando si el paciente se ha vacunado o no para que nosotros podamos recapitular esa variable y en un futuro próximo entrenar al modelo con ella.
¿Cómo se entrena el modelo?
Tenemos un dataset con miles de datos. Para la Covid son 1.800 pacientes más o menos (si un paciente ingresa dos veces computa como dos registros), y cada paciente tiene las cien variables que hemos acordado. Lo metemos en la nube y el modelo, al que previamente le decimos qué tipo de algoritmo queremos que aplique, modifica los datos: trata los nulos, filtra los que no son buenos y da una serie de pasos. Una vez hace todo ese cribado le pasamos otro dataset igual pero con otro tipo de datos: lo probamos con información de pacientes de marzo a noviembre y luego le pasamos diciembre para que valide los datos que ha probado; los limpia, valida si los que le entran son buenos, y decide si mandarlos a UCI o no con una enorme probabilidad de acierto.
Cuando acabas un modelo, ¿sigues después “educando” a la máquina?
Claro. En los proyectos de heridas por presión y de caídas, por ejemplo, volvemos a recopilar los datos cada seis meses, y los mandamos a la máquina a ver qué ha pasado en ese tiempo. Dependiendo de la estadística y los datos que nos devuelva, volvemos a entrenar el modelo otra vez picando nuevas instrucciones, o lo dejamos como estaba. Si ya no hay tantas caídas como al principio, pongo por caso, será que el modelo ha hecho su trabajo, y entonces queda desfasado porque ya no va a acertar con la misma precisión y hay que volver a meterle datos. Identificaríamos variables que ya no aportan información relevante y meteríamos otras nuevas que nos vayan diciendo los sanitarios.
Utilizáis un software específico; ¿ya lo conocías antes de empezar a trabajar?
Nosotros trabajamos con herramientas de Microsoft. Lo que más uso yo son herramientas de Azure. Machine Learning Studio, Jupiter, Azure the Box… Todos los hospitales de Ribera tienen su propio sistema operativo, que antes se llamaba Florence y ahora es Cynara. En cada universidad se aprenden programas distintos, en Alicante yo aprendí R y Python, que ahora está muy de moda. Para programar, para estadística… es una maravilla.
¿Cómo es tu día a día como data scientist en futuRS?
El trabajo me divierte, aunque también es un reto constante para sacar adelante proyectos novedosos. No es nada rutinario, porque cada día surgen iniciativas, cambios y mejoras y, además, hay que investigar y reflexionar sobre cada propuesta. Las cosas cambian muy rápidamente. Ahora el Covid nos lleva a un ritmo aún mayor, porque si las condiciones del virus cambian, nosotros debemos anticiparnos. Es una prueba de fuego tremenda, pero el ritmo que nos impone también nos sirve de aprendizaje. Además, el ambiente de trabajo es muy bueno. Todos estamos volcados en proyectos que sabemos que van a cambiar la vida de muchos pacientes. A todos nos importa mucho lo que hacemos”.
¿Qué hace a un buen data scientist? ¿Cuáles son las mejores prácticas?
La curiosidad por saber cuál puede ser el mejor modelo. La constancia. Las ganas: tienes que investigar mucho los datos con los que vas a trabajar y explorar siempre formas alternativas. Si no funciona un algoritmo, no desanimarse; el 80% de los modelos predictivos se tiran a la basura. No rendirse; alguna vez habrá que tirar la toalla, pero que no sea a la primera ni a la tercera. Cuando descubres algo, la sensación es estupenda.
¿De qué te sientes más orgulloso?
Casi todos mis amigos son del sector sanitario y muchos trabajan aquí. Que un enfermero o un médico te diga que lo que haces es muy útil, que les ha servido, es muy satisfactorio. Lo que más me motiva es que siempre se descubre algo nuevo. Solo vemos el pico de la montaña, y aún queda tanto por hacer… Las posibilidades son infinitas.
Calle Santiago Ramón y Cajal, número 43, 2ª planta Elche 03203 (Alicante)
Calle Vía de los Poblados, 1 · Parque tecnológico de Alvento · 28033 (Madrid)