El algoritmo que nos dice de qué están hechas las galaxias con una eficiencia del 99%

¿Dónde nacen las estrellas, dónde se posa un agujero negro supermasivo o dónde abundan hidrógeno, oxígeno o nitrógeno? Estas son las pistas que persiguen los astrónomos, ya que les permiten determinar qué compone una galaxia. Aunque los diagramas que las explican se han analizado manualmente desde hace décadas, toman mucho tiempo y requieren de un esfuerzo mayor; ahora, un algoritmo entrenado con aprendizaje de máquina hace la tarea en solo minutos ayudando a desentrañar los misterios del universo en el que vivimos.

Mosaico de las galaxias seleccionadas por el proyecto de SALSA para el estudio de sus campos magnéticos. Crédito: Instituto de Astrofísica de Canarias.

La era tecnológica ha impactado todas las áreas del conocimiento, y el cosmos no se ha quedado atrás, un campo en el que la investigadora Katherine Andrea Caballero Soto, magíster en Astronomía de la Universidad Nacional de Colombia (UNAL), se aventuró queriendo complementar, a través de inteligencia artificial (IA), la mirada de los grandes telescopios que toman registros fotométricos y espectroscópicos de galaxias y estrellas, las cuales varían según su composición o su distancia.

Estar a una distancia de años luz de la Tierra ya no es un inconveniente para encontrar el núcleo de una galaxia activa, una en la que fantaseamos con que haya algún lugar parecido a nuestro planeta, o en donde tal vez haya formas de vida que desconocemos.

De hecho, desde la década de 1980 expertos y científicos elaboran diagramas que muestran los elementos que componen los núcleos de estos sistemas galácticos, pero la información que recopila un telescopio o una técnica de observación llega a ser tanta, que se hace casi imposible hacer cálculos rápidos y sencillos.

Por eso la investigadora Caballero implementó distintos algoritmos de aprendizaje automático en el estudio de los núcleos activos de galaxias (AGN), pues quería saber si la potencia de estos avances de IA son tales que, aquellas clasificaciones manuales que hacen astrónomos profesionales y que pueden tomar horas o hasta días, ahora se realicen en cuestión de segundos.

Los AGN son regiones extremadamente brillantes en el centro de una galaxia que se alimentan por el material que cae en agujeros negros gigantes supermasivos; emiten luz y energía en todas las longitudes de onda, desde rayos X hasta ondas de radio.

Su estudio ha despertado el interés de los científicos porque entenderlas nos daría una visión de cómo han evolucionado históricamente tanto las galaxias como los agujeros negros; cómo se comporta el cosmos en estas inmensas concentraciones de energía, e incluso cómo se podría haber distribuido la materia oscura en el universo.

Para desarrollar su propuesta, la investigadora utilizó la base de datos astronómicos de la Encuesta Sloan Digital Sky (SDSS), una de las más detalladas del mundo y de acceso gratuito, que tiene información sobre las líneas de emisión, unas “firmas” espectrales específicas de luz que hablan acerca de los materiales y elementos que componen una galaxia. De esta se recopiló la información de unas 250.000 galaxias.

Imágenes generadas por el algoritmo en la identificación de los elementos de cada galaxia. Foto: Katherine Andrea Caballero Soto, magíster en Astronomía de la UNAL.

Para eso se tuvieron en cuenta variables como la baja densidad de electrones en el espacio, la cual hace que existan mayores probabilidades de que se presenten transiciones prohibidas de los átomos ionizados como OIII, NII, SII, o líneas espectrales de hidrógeno H-alfa (Hα) y H-beta (Hβ), características principales que permiten determinar si el objeto es una galaxia de núcleo activo, o si por el contrario es formadora estelar.

Los datos se complementaron con los registros de fotometría de estas galaxias, imágenes de distintos rangos de brillo y filtros de color que emiten estas estructuras cósmicas. Tomando estas características se entrenaron distintos algoritmos es busca de aquel que pudiera clasificar con precisión el tipo de galaxia del que se estaba hablando; estas podían ser: (i) de núcleo activo, en las que abundan oxígeno, nitrógeno y azufre, (ii) estelares, en las que nacen estrellas y el elemento principal es hidrógeno, y (iii) una combinación de ambas.

Según la investigadora, “de todos los algoritmos que se desarrollaron en el lenguaje de programación Python, el de redes neuronales obtuvo el mejor desempeño, pues alcanzó alrededor de un 99 % de eficiencia en la identificación de estas galaxias: de 250.000, clasificó alrededor de 248.000”.

“Estamos viendo la astronomía a través de los ojos del aprendizaje de máquina, ya que optimiza el trabajo y permite tener la información y parametrización correcta de cualquier objeto celeste, lo que posibilita estudiar no solo las galaxias sino también las estrellas y nebulosas, e incluso clasificar ondas gravitacionales”, agrega.

Por otro lado, indica que “es una herramienta que queda abierta al público, ya que el código con el que se generó el algoritmo está disponible para que cualquier investigador lo utilice; y en la literatura sobre el tema no había acceso, lo que quiere decir que usaban lenguajes de programación no gratuitos y con información muy específica”.

Se espera que este desarrollo se convierta en una plataforma web en la que los interesados utilicen el algoritmo para determinar el tipo de galaxia que están estudiando, o que quieren analizar más a fondo.