Nuevo método de IA que facilita determinar el sexo de esqueletos prehistóricos

Las primeras incógnitas que se tratan de desvelar cuando aparecen restos humanos en un yacimiento arqueológico son la época a la que corresponden y si pertenecían a un hombre o a una mujer. Para la datación se emplean técnicas avanzadas como la del carbono 14, que dan resultados muy buenos en un tiempo razonable. Sin embargo, para determinar el sexo hay que realizar una serie de pruebas que ralentizan la obtención del resultado. Ahora, una nueva técnica basada en inteligencia artificial la facilita esta tarea y tiene una precisión del 95%.

El método nuevo para determinar el sexo de restos óseos prehistóricos ha sido desarrollado por investigadores de las universidades de Valladolid, Murcia, Burgos y Uppsala (Suecia), y ha sido publicado han publicado la prestigiosa revista Journal of Archaeological Sciences Reports.

La técnica se logrado gracias al estudio osteométrico de 109 esqueletos de la población calcolítica de Camino del Molino, que ha permitido comparar diferentes técnicas de diagnóstico sexual en huesos largos y probar la validez del aprendizaje automático en muestras prehistóricas con excelentes resultados.

Camino del Molino, en el municipio de Caravaca de la Cruz (Región de Murcia), es una sepultura datada en el III milenio a.C. que preserva la mayor colección de esqueletos de esta cronología. En esta tumba se inhumaron 1348 individuos, de ambos sexos y todas las edades, lo que lo convierte en el mayor cementerio prehistórico documentado hasta la fecha. La preservación de 168 esqueletos articulados completos de adultos ha permitido realizar por primera vez un análisis osteométrico exhaustivo de las mujeres y los hombres de esta sepultura para valorar el dimorfismo sexual, es decir, las diferencias en el tamaño de mujeres y hombres. 

Sonia Díaz Navarro, investigadora posdoctoral de la Universidad de Valladolid encargada de liderar esta investigación, apunta que los huesos largos son una excelente alternativa para la estimación del sexo cuando las partes anatómicas más dimórficas (el cráneo y la pelvis) no se conservan o están muy alteradas, algo recurrente en enterramientos prehistóricos, donde además los restos esqueléticos aparecen generalmente desarticulados y alterados. Estos condicionantes provocan que sea realmente complicado poder estimar el sexo de los individuos en estos contextos, un aspecto fundamental para cualquier estudio bioarqueológico con el fin de definir un conjunto demográfico específico o clasificar restos aislados.

Este trabajo pretende superar la escasez de métodos que puedan aplicarse a la estimación del sexo del gran volumen de restos aislados del Camino del Molino y de otras series esqueléticas mediterráneas de la Prehistoria Tardía con alta afinidad biológica y que comparten condiciones ambientales similares.

Para ello, se han tomado diferentes variables osteométricas de los húmeros, cúbitos, radios, fémures y tibias de la muestra de 109 esqueletos articulados de sexo estimado a partir de métodos antropológicos estándar y análisis de ADN de una muestra de control.  El resultado obtenido es un conjunto de funciones discriminantes y modelos de clasificación para estimar el sexo mediante análisis discriminante lineal y enfoques de aprendizaje automático en huesos largos.

Gracias a este análisis se han obtenido 52 funciones discriminantes de fácil aplicación con umbrales de predicción superiores a 80 puntos utilizando medidas independientes (22) y combinando medidas de un mismo hueso (30). Los mejores modelos discriminantes para la predicción del sexo han sido los basados en la anchura de las epífisis proximales del fémur y el húmero o la combinación de estas con otras variables, alcanzando valores cercanos a 98 puntos.

El enfoque de aprendizaje automático Random Forest arroja una precisión de 94 puntos, confirmando la importancia de la anchura de las epífisis en la clasificación del sexo. Esto debe relacionarse con el hecho de que las epífisis proximales contienen las inserciones musculares sexualmente dimórficas y transmiten el peso, por lo que la anatomía de la región se ve indudablemente afectada en términos de tamaño y forma, lo que repercute en el dimorfismo sexual y, por tanto, en la precisión de la medición resultante.

La combinación de Análisis Discriminante Lineal y Random Forest permite comparar diferentes técnicas para el diagnóstico sexual con huesos largos y probar la validez del aprendizaje automático en bioarqueología. A diferencia del análisis discriminante univariante, el enfoque random forest utiliza todas las variables de todos los huesos simultáneamente y permite clasificar la importancia de los huesos largos en la discriminación sexual. Por lo tanto, este enfoque es más completo, ya que considera las correlaciones entre los huesos largos en lugar de tratarlos como observaciones independientes. Por el contrario, realizar análisis discriminante lineal en cada hueso largo permite a los investigadores predecir el sexo de los individuos en otras colecciones prehistóricas con características similares que no tienen una muestra tan completa.

A pesar de que la estimación sexual a partir de huesos largos ha sido frecuentemente desarrollada en colecciones osteológicas de todo el mundo desde mediados del siglo XX, hasta el momento no se habían obtenido funciones discriminantes exitosas sobre poblaciones prehistóricas, por no disponer de suficientes muestras de esqueletos individualizados y bien conservados que arrojen resultados aceptables.

Como cada población está sujeta a diferentes factores genéticos, culturales y ambientales, es necesario el uso de fórmulas basadas en poblaciones lo más homogéneas posible a la que es objeto de estudio. Siguiendo estos criterios, una función puede aplicarse tanto a la propia población que se ha utilizado para su elaboración, como a aquellas que presenten índices de dimorfismo sexual similares, con alta afinidad biológica y que compartan condiciones ambientales similares. Por ello, los investigadores de este estudio proponen el uso de estas funciones como parte de una base alternativa para realizar estimaciones de sexo más fiables en el gran volumen de restos desarticulados de Camino del Molino, así como en otras series esqueléticas prehistóricas mediterráneas homogéneas espacial y cronológicamente.