Sistemas de búsqueda Question-Answering

Recuperación y organización de la información

Sistemas de búsqueda Question-Answering

   

Una de las tareas más avanzadas en Recuperación de Información (RI) es aquella que busca, no documentos relevantes ante una necesidad informativa dada, sino respuestas precisas a necesidades de información concretas, empleando una gran colección de documentos. Esto es lo que se conoce como búsqueda de respuestas, Question Answering en inglés, cuyas siglas, QA, suelen utilizarse sin traducir. Los sistemas de Question-Answering deben extraer la respuesta después de localizar la zona de los documentos que pueda estar relacionada con la afirmación: "Se busca encontrar un fragmento de texto mínimo que responda la pregunta". Por eso, algunas aproximaciones a este problema están basadas en la recuperación de pasajes o fragmentos de texto (VICEDO 2003; WOODS 2000). La respuesta puede ser extraída después mediante algún proceso automático o, si el sistema no es capaz de proporcionar una respuesta válida de una manera totalmente autónoma, debe disponerse algún proceso de realimentación con el usuario, para que pueda satisfacer su necesidad informativa. La interacción con el usuario ayuda al sistema de Question-Answering a encontrar mejores respuestas. A su vez, el sistema de Question-Answering ayuda al usuario a encontrar la respuesta más rápidamente.


El proceso interactivo de Question-Answering posee hoy día un amplio interés, debido al aumento de la web y a la necesidad cada vez más urgente de obtener información precisa. A ello unimos los avances en Recuperacion de la Informacion y en el procesamiento del lenguaje natural (PLN), que han hecho resurgir de nuevo el interés en los sistemas de Question-Answering claramente enfocados a la web. La enorme cantidad de información en la web hace de Question-Answering una poderosa herramien- ta para encontrar información ante una necesidad informativa dada.


Ahora bien, en contraste con los motores de búsqueda en internet, los sistemas de Question-Answering deben proporcionan respuestas breves y concisas. Un problema adicional de la búsqueda de respuestas en la web es el entorno multilingüe de este medio. Efectivamente, los usuarios que buscan en la web normalmente encuentran documentos en varios idiomas, habitualmente en el idioma en el que se realiza la consulta, y también en el idioma más utilizado en internet, el inglés. Por este motivo, para resolver sus necesidades informativas, el usuario debe tener al menos un conocimiento pasivo de esta lengua, así como algún tipo de herramienta lingüística, como diccionarios bilingües o programas de traducción automática, que le ayuden a traducir su pregunta al inglés o los documentos recuperados a su propio idioma


Podemos decir que la investigación en sistemas de búsqueda de pregunta-respuesta se ha incrementado a partir de la introducción de un foro para su evaluación como parte de la Conferencia TREC en 1999 (limitada al lenguaje inglés), y más recientemente en sistemas de Búsqueda de Respuestas Multilingüe, siendo en el año 2003 la primera ocasión que se incluyó la evaluación de sistemas de BR como parte del CLEF y donde sólo se presentó un sistema de búsqueda de respuestas para tratar información en el lenguaje Español.



Página creada por Cristian Cano Esteban para la asignatura Recuperacion de la Información.