El grupo de investigación SINAI (Sistemas INteligentes de Acceso a la Información) de la Universidad de Jaén, junto con investigadores de la Universidad de Alicante, ha creado un ‘bot’, denominado FIERO, que recoge los insultos y los almacena con el objetivo de generar uno de los recursos lingüísticos más utilizados en Tecnologías del Lenguaje Humano (TLH), los lexicones (listas de palabras).
Este trabajo se enmarca en un proyecto de investigación orientado a desarrollar modelos del lenguaje, denominado LIVING-LANG, que dirige y coordina este grupo de investigación de la UJA. Dentro del marco de este proyecto, los investigadores de la Universidad de Jaén trabajan en entrenar, mediante algoritmos de aprendizaje automático, sistemas computacionales basados en Tecnologías el Lenguaje Humano para afrontar diferentes problemas sociales muy de actualidad como, por ejemplo, la detección de noticias falsas (‘fake news’), el ciberacoso, la propagación del discurso del odio y del lenguaje ofensivo, o la detección de ciertos problemas de salud mental como la anorexia, la depresión e incluso la prevención del suicidio.
“Para desarrollar estos sistemas es fundamental e imprescindible contar con recursos lingüísticos que permitan entrenar a los sistemas de aprendizaje automático. Concretamente, para los sistemas de detección automática de lenguaje ofensivo, es muy interesante contar con distintos diccionarios y lexicones de insultos, palabras malsonantes”, indican desde el grupo SINAI.
Debido a la dificultad de conseguir los mismos, los investigadores del proyecto LIVING-LANG buscan la colaboración de la ciudadanía en general, para lo que han recurrido a la creación de FIERO, que se ejecuta dentro de la aplicación de mensajería Telegram y se instala en los smartphones (android y iOS) con el único objetivo de recoger insultos de la gente. Una vez instalada en el móvil, se abre un diálogo en el que el usuario puede incluir todos los insultos (cuantos más mejor) a los que FIERO contesta con cierta sorna e ironía con el fin de conseguir más insultos por parte del usuario. “El sistema va almacenando todos estos insultos que posteriormente serán procesados para ser incluidos en un recurso léxico que será puesto a disposición de la comunidad científica y que servirá además para entrenar a los sistemas de aprendizaje automático que se están desarrollando”, explican los investigadores.
Para acceder a FIERO, el usuario debe tener instalada previamente la aplicación de Telegram y a continuación basta con pulsar en el siguiente enlace https://t.me/InsultaAFierobot. Una vez dentro, es necesario proporcionar datos sobre la edad y el sexo para comenzar a enfadar a FIERO.