Eneko Agirre, profesor de la Facultad de Informática de la UPV/EHU, director del centro de investigación HiTZ (http://hitz.ehu.eus) y miembro del grupo de investigación Ixa Taldea (http://ixa.si.ehu.eus), ha recibido uno de los premios de investigación de Google – Google Faculty Research Awards – que se conceden anualmente. El profesor Agirre ha contado en su estudio con la colaboración de los profesores Aitor Soroa y Gorka Azkune, la investigadora Arantxa Otegi, el alumno de doctorado Jon Ander Campos, el alumno de máster Aitor Agirre y el alumno de grado Eduardo Vallejo. En el ámbito del procesamiento del lenguaje Google ha concedido 11 premios. En conjunto, Google ha premiado 150 propuestas (entre 917 candidatas de 18 áreas del ámbito de la Inteligencia Artificial), enviadas por 330 universidades de 50 países. Solamente el 25% provienen de universidades de fuera de Estados Unidos, y en el caso del procesamiento del lenguaje natural solamente hay un premio en Europa. El profesor Eneko Agirre es de los pocos investigadores que ha conseguido el premio en tres ocasiones. El premio está dotado de 70.000 dólares, que financiarán su proyecto titulado ‘Conversational Question Answering agents that learn after deployment’, centrado en desarrollar sistemas de diálogo que sean capaces de aprender mientras interactúan con los usuarios.
Actualmente accedemos a la información existente en Internet mediante buscadores como Google o Bing, que nos devuelven los documentos relevantes que buscamos. Esto está cambiando, gracias al desarrollo de asistentes virtuales que entienden nuestra voz – hablamos de Siri, Alexa o Google Assistant, entre otros. Estos asistentes se están popularizando rápidamente, ya sea mediante los móviles o mediante los altavoces inteligentes como Amazon Echo o Google Home, y están cambiando nuestra forma de comunicarnos con las máquinas. Hoy en día hay un número creciente pero limitado de aplicaciones que podamos acceder mediante diálogo, en parte debido a que las máquinas no entienden la complejidad del lenguaje y se pierden fácilmente en la ambigüedad de nuestro lenguaje. Estos sistemas se entrenan en el laboratorio, y cuando su calidad es la suficiente es cuando se ponen en marcha con los usuarios.
Mediante técnicas de inteligencia artificial el proyecto premiado pretende que los sistemas de diálogo puedan aprender de los propios usuarios una vez ya estén en marcha. De esta forma el rendimiento mejorará con el uso, superando a los sistemas que solamente se han entrenado en el laboratorio. El reto consiste en detectar cuándo un usuario está satisfecho con las contestaciones del sistema y cuando no, de una forma natural y no intrusiva. Para ello, el grupo de investigación recogerá grandes cantidades de diálogos entre dos personas, donde una persona hace las preguntas y otra persona le responde basándose en la información que reside en un documento en concreto. Estos diálogos servirán para entrenar los modelos automáticos que detectan cuándo la persona que hace las preguntas está satisfecha y cuando no. Los experimentos sobre este conjunto de datos servirán así para validar en el laboratorio las técnicas propuestas. Si los experimentos tienen éxito el sistema propuesto ayudará a mejorar la calidad de muchos chatbots que conocemos actualmente.
Este proyecto es continuación de otro proyecto premiado por Google el año anterior, donde se construyeron sistemas conversacionales de pregunta-respuesta sobre dominios concretos. Los resultados han sido muy positivos, tanto en inglés como en euskera, y han dado lugar a sendas publicaciones con los resultados preliminares en el seminario sobre sistemas conversacionales del congreso NeurIPS como en el congreso sobre recursos LREC. La información recogida será el foco de varios trabajos del máster en procesamiento de lenguaje http://ixa.eus/master el curso que viene.
Uno de los dominios de conversaciones en inglés del proyecto son preguntas sobre cocina y alimentación, donde se han recogido conversaciones como la siguiente, basada en la información existente en el foro https://cooking.stackexchange.com.
Aunque el proyecto se centre sobre todo en conversaciones en inglés, también han trabajado con conversaciones en euskera. Para ello el año pasado el grupo Ixa puso en marcha una campaña para la captación de voluntarios para la recogida de conversaciones en euskera. La campaña tuvo muy buena acogida, y se recogieron conversaciones en euskera sobre personas, basada en la información existente en Wikipedia (en la imagen inferior se puede ver un ejemplo). Si alguien quiere unirse a la campaña, basta con acceder a http://ixa.eus/lagundu y dar el nombre.