La Universidad de Alicante, a través del Grupo de Investigación Transducens del Departamento de Lenguajes y Sistemas Informáticos, participa en el proyecto europeo “GoURMET: Global Under-Resourced MEdia Translation“, que aborda la traducción automática de noticias globales en lenguas con poca presencia digital.
Coordinado por la Universidad de Edimburgo, este proyecto tendrá una duración de tres años y tiene como socios a la Universidad de Alicante, la Universidad de Edimburgo, la Universidad de Amsterdam, la British Broadcasting Corporation (BBC) y Deutsche Welle (DW). Concedido en el marco de la convocatoria euroepa Research & Innovation Action H2020-ICT-2029, acaba de iniciar su andadura en 2019. De hecho, esta semana la sala de reuniones de la Escuela Politécnica Superior I (EPS-1) ha acogido la reunión de inicio de proyecto.
Idiomas de interés
El proyecto desarrollará sistemas de traducción automática neuronal para pares de lenguas y dominios con pocos recursos. Estos sistemas se basan en técnicas de aprendizaje automático con redes neuronales similares a las utilizadas desde hace unos años en otros campos de la inteligencia artificial.
“Para obtener la calidad deseada, los sistemas de traducción automática neuronal requieren de una gran cantidad de textos paralelos -textos en un idioma junto con su traducción profesional a otro idioma-, que no están disponibles para idiomas de interés para los socios del proyecto como el turco, el suajili, el guyaratí, el búlgaro o el yoruba”, explica el investigador principal del proyecto de la UA, Felipe Sánchez. GoURMET , añade, abordará este reto usando técnicas tales como la generación de traducciones sintéticas o la incorporación de otros recursos existentes, como diccionarios.
Los sistemas desarrollados serán probados por los servicios internacionales de la BBC y la DW, por un lado, para realizar un seguimiento de noticias producidas por medios en las lenguas locales traduciéndolas automáticamente al inglés, y, por otro, para traducir noticias originalmente escritas en inglés a los idiomas de su audiencia internacional.
Según Sánchez, “los investigadores de la Universidad de Alicante, en colaboración con el resto de socios de GoURMET, se encargarán de la recolección de textos paralelos de Internet y de otros datos lingüísticos que puedan ser de utilidad y de integrarlos en los sistemas de traducción automática neuronal. En algunos casos esto comportará la creación de traducciones sintéticas y la explotación inteligente de textos no traducidos”.
Grupo Transducens
El Grupo de Investigación Transducens de la Universidad de Alicante se formó en 2004. Sus líneas de trabajo se centran especialmente en la traducción automática con énfasis en la traducción entre lenguas emparentadas (especialmente las románicas); anotación fonética de textos para su lectura en voz alta; indexación y lenguajes de marcado en bibliotecas digitales; inferencia gramatical a partir de muestras estocásticas y sus aplicaciones; y educación asistida por ordenador.