Después de analizar grandes cantidades de resonancias magnéticas y tomografías por emisión de positrones (PET/CT), el modelo de aprendizaje de máquina anticipa cuáles pacientes responderían mejor a la quimioterapia neoadyuvante, el tratamiento principal para el cáncer de mama, enfermedad que cada año afecta a unas 6.700 colombianas.
Marco Antonio Guarín Insignares, magíster en Física Médica de la Universidad Nacional de Colombia (UNAL), es el responsable de este avance tecnológico que consiste en entrenar a un grupo de algoritmos especializados en “leer” altos volúmenes de datos, y que ayudaría a tener mejores manejos de la enfermedad, enfocados en el desarrollo y la evolución de cada paciente.
En el estudio se analizaron 30 resonancias magnéticas y tomografías por emisión de positrones del mismo número de pacientes diagnosticadas, mediante biopsias, con cáncer de mama avanzado. La biopsia es el procedimiento mediante el cual se extrae una muestra de tejido o células del cuerpo para analizarlas a través del microscopio.
“Esto es novedoso porque el análisis se realizó durante el tratamiento, es decir que las pacientes ya estaban en quimioterapia, luego se sometían a cirugía para extraer el tumor, y se verificaba que hubiera éxito en la disminución de las células cancerosas”, explica el experto.
Después se entrenó el modelo con las imágenes diagnósticas tomadas antes del tratamiento, para ver si era capaz de predecir lo ocurrido, y se encontró una precisión de alrededor del 95 %, una sensibilidad para identificar los datos del 90 % y una especificidad del 80 %.
Estos valores son muy prometedores pues muestran que los algoritmos utilizados (Boruta, Wilcoxon y bosque aleatorio) son una herramienta que facilita entender el uso de la quimioterapia neoadyuvante, ya que antes y durante el tratamiento se puede establecer si es necesario cambiar de estrategia porque no está funcionando.
“En otros trabajos se han utilizado grandes bases de datos sobre imágenes diagnósticas de pacientes con cáncer, pero esto no permitía actuar durante o después del tratamiento; además, para el cáncer de mama aún no se había trabajado con tomografías de emisión de positrones, lo cual amplía el desarrollo de estas técnicas de machine learning”, indica el investigador Guarín.
Su trabajo forma parte de un proyecto de colaboración entre la Fundación Centro Diagnóstico Nuclear (Bogotá) y el Instituto de Oncología Ángel H. Roffo (Buenos Aires), con el cual se busca dar mejores respuestas al tratamiento del cáncer de mama, uno de los más comunes y principal causa de muerte de las mujeres.
Según el Ministerio de Salud y Protección Social, de los 6.700 casos que se registran cada año en Colombia, el 64,7 % son detectados en etapas avanzadas, por lo que anualmente fallecen alrededor de 2.250 mujeres.
El investigador Guarín señala que “algunas investigaciones muestran que tratamientos como la quimioterapia coadyuvante tienen entre 10 y 50 % de efectividad, lo que quiere decir que sigue habiendo un amplio margen de mujeres que no logran beneficios en esta primera etapa para atacar la enfermedad”. Precisamente ahí nace su interés por indagar desde la ciencia por qué ocurre esto y si es posible predecirlo con algoritmos del modelo de aprendizaje profundo de inteligencia artificial.
Modelo de inteligencia artificial
Una de las partes más importantes del trabajo del magíster fue la limpieza o depuración de la información, ya que por cada paciente había al menos 1.702 características, lo cual suponía un reto para el análisis; en la literatura se recomienda trabajar con cerca de 10 rasgos.
En este caso las variables más determinantes fueron: (i) la producción de un receptor de estrógeno, que en la literatura se ha encontrado como un indicador de la efectividad del tratamiento, y (ii) una fórmula matemática que genera matrices de coocurrencia entre los pixeles que hay en las imágenes diagnósticas, algo así como una relación entre la escala de grises que están distribuidas en algunas regiones de interés para identificar el cáncer.
Los modelos de inteligencia artificial se diseñaron en lenguaje de programación Python y en el software 3D Slicer, ambos de libre acceso, en un método controlado, lo que quiere decir que las características tenían una etiqueta de información en los algoritmos. También se contó con la colaboración de una radióloga con más de 12 años de experiencia, quien se encargó de la clasificación y el análisis.