Redes bayesianas, para entender las relaciones en el medio ambiente

Redes bayesianas, para entender las relaciones en el medio ambiente

Grafo de las redes bayesianas de un espacio natural.

¿Cómo son las relaciones establecidas en un ecosistema? Resulta muy complicado responder a esta pregunta, debido a la enorme cantidad de elementos de interactúan entre sí. Por este mismo motivo, se recurre a herramientas matemáticas como las redes bayesianas, para explicar las relaciones entre los diversos actores del medio ambiente.

Así lo hecho la investigadora de la Facultad de Ciencias Experimentales de la Universidad de Almería, Ana Maldonado, en cuya tesis ha desarrollado varios estudios que demuestran la idoneidad de las redes bayesianas, para explicar fenómenos complejos en la naturaleza.

¿Qué son las redes bayesianas?

Los ecosistemas mantienen una relaciones muy íntimas entre todos sus elementos, tanto es así que la variación en alguno de los parámetros puede alterar el resto. Una realidad sobradamente conocida desde hace mucho tiempo, pero que la tecnología actual le ha dado una nueva dimensión, gracias a las posibilidades que ofrecen las herramientas matemáticas en combinación con equipos computacionales cada vez más potentes.

Para quien no lo sepa, las redes bayesianas son modelos probabilísticos que funcionan bien cuando hay una gran incertidumbre, provocada por un número de variables elevado. Vamos, justamente lo que ocurre en el medio ambiente.

Y en su tesis, Ana Maldonado las emplea para el análisis de datos ambientales que presentan una serie de problemas, que ella describe como “la abundancia de ceros en las variables predictoras, elevada variabilidad de la variable objetivo, presencia de valores perdidos o elevada complejidad del sistema”. Con el objetivo de contar con modelos que arrojen “conclusiones fiables y ayuden a entender mejor el mundo real”, dice esta investigadora.

En esta entrevista explica con más detalle su trabajo.

Ana Maldonado, especialista en la aplicación de redes bayesianas al medio ambiente.
Ana Maldonado.

Explica el objetivo de tu tesis

Brevemente, la tesis se centra en el análisis de datos ambientales que presentan una serie de problemas, como la abundancia de ceros en las variables predictoras, elevada variabilidad de la variable objetivo, presencia de valores perdidos o elevada complejidad del sistema. El objetivo es obtener modelos que permitan obtener conclusiones fiables y ayuden a entender mejor el mundo real.

Usas redes bayesianas para analizar diversos aspectos del medio ambiente, ¿por qué eliges esta herramienta? ¿qué aportan frente a otras?

Los datos ambientales suelen estar sujetos a incertidumbre, por lo que contar con una herramienta probabilística capaz de tratar con esta incertidumbre es muy útil. Además, las redes bayesianas son herramientas muy versátiles que permiten resolver un buen número de problemas, como por ejemplo problemas de clasificación o regresión. Al ser una herramienta probabilística, no solo devuelven un valor, sino la distribución de probabilidad condicionada de cada variable del modelo, lo cual permite calcular muchas cosas, como la media, el valor más probable o cualquier probabilidad de interés. Otro punto a favor es que estos modelos pueden admitir tanto variables discretas como continuas, dependiendo de cómo se representen las distribuciones de probabilidad condicionada, lo cual viene muy bien cuando se trata con datos del mundo real, que pueden ser de cualquier tipo.

Por otro lado, esta herramienta permite la inclusión de conocimiento experto. Lo más habitual es que este conocimiento sea del tipo A afecta a B y B afecta a C, es decir, de relaciones causales entre las variables. Gracias a la representación gráfica de la red bayesiana es muy fácil que los expertos establezcan estas relaciones, ya que solo tienen que añadir o quitar enlaces entre las variables.

¿En qué forma ayudan las redes bayesianas a modelar algún aspecto ambiental?

Todo lo que ocurre en nuestro entorno, incluido el medio ambiente, es el resultado de relaciones entre distintos componentes del medio. Las redes bayesianas son herramientas probabilísticas que nos ayudan a cuantificar esas relaciones en términos de distribuciones de probabilidad condicionada. Una red bayesiana puede representar relaciones causales entre variables, donde cada nodo de la red es una variable y el enlace entre 2 nodos representa la existencia de dependencia entre ellas. Pero la red bayesiana también sirve para modelar problemas ambientales incluso cuando no se definen relaciones causales entre las variables. Por ejemplo, uno puede estar interesado en una única variable, para predecir su valor, y elegir otro tipo de grafo que discrimine mejor su valor más probable.

Estimación del riesgo de contaminación de humedales andaluces realizada con redes bayesianas.
Estimación de riesgo de contaminación de aguas superficiales realizada con redes bayesianas.

Por ejemplo, avanzas en campos como la calidad de las aguas superficiales, ¿qué novedades introduces? ¿Qué consigues modelar con estas herramientas?

En el ámbito de las aguas superficiales, muchos trabajos proponían métodos para calcular el riesgo de contaminación por nitratos basado en índices. Nosotros propusimos un método para calcular la probabilidad de no cumplir con los objetivos de calidad de la Directiva Marco de Agua. En este sentido, entendemos el “riesgo” como la probabilidad de que una masa de agua exceda una determinada concentración de nitrato. Este valor umbral fue de 25 mg/L, ya que la Directiva Marco de Agua establece que las masas de agua superficial están en “buen estado” si su concentración de nitrato es inferior a 25mg/L. Otra de las novedades es que, para reducir el error del modelo, optamos por realizar una regionalización del terreno y construir un modelo para cada una de las partes obtenidas. El modelo que obtuvimos relaciona distintas variables, principalmente temperatura, precipitación y usos del suelo, con la concentración de nitrato en aguas superficiales. Los resultados obtenidos los plasmamos en un mapa de riesgo de superar el valor umbral.

También planteas un análisis del socio-ecosistema andaluz y su relación con el abastecimiento de servicios ecosistémicos, ¿cuáles son las principales conclusiones en esta línea? ¿qué se puede llegar a conocer con estas herramientas?

En este trabajo construimos un modelo que integra los componentes social, económico y ambiental, y los relaciona con los servicios de los ecosistemas. El objetivo que perseguimos es analizar la influencia de distintos escenarios socioeconómicos en la generación de servicios de los ecosistemas, centrándonos en regiones del territorio identificadas como paisajes culturales.

En Andalucía, estos paisajes culturales están localizados, más o menos, en Sierra Morena y las Sierras Béticas. Son entornos rurales, muy heterogéneos, donde el ser humano y la naturaleza han co-evolucionado.

Un típico ejemplo de paisaje cultural es la dehesa. La tendencia actual de estos lugares es el abandono por parte de la población, debido a, entre otras cosas, la falta de servicios. Brevemente, los 3 escenarios que propusimos en el trabajo fueron:

  • no hacer nada, es decir, dejar que la despoblación aumente;
  • intensificación, en el que la población crece mucho;
  • desarrollo rural, en el que la población aumenta de forma sostenible para el medio y se fomentan otros factores, como la alfabetización.

La conclusión principal del análisis de los escenarios es que el tercero cumple con los objetivos de inclusión social y mantenimiento de los servicios de los ecosistemas, mientras que los otros 2 no. Esta herramienta es muy útil para comprender las relaciones entre los distintos componentes de un sistema tan complejo y, por tanto, ayuda a tomar decisiones.

No hay comentarios

Dejar una respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.