Recuperación y organización de la información
Estado actual de los sistemas BR
Los sistemas actuales de búsquedas de respuestas afrontan su tarea desde la perspectiva del usuario casual. Es decir, se enfocan en responder preguntas simples sobre hechos concretos a partir de una colección de documentos donde la respuesta se encuentra en forma explícita en un sólo documento. Estas preguntas generalmente pueden responderse con palabras o frases que denotan el nombre de una persona, de un lugar, una fecha, etc. Sin embargo, los sistemas de Question-Answering del futuro permitirán resolver preguntas más complejas a partir de la fusión de la información contenida en varios documentos.
Los sistemas de Busqueda de Respuestas típicamente consideran los siguientes procesos: (i) el análisis de la pregunta, (ii) la recuperación de documentos relacionados; (iii) la selección de pasajes relevantes, y (iv) la extracción de fragmentos respuesta. Los sistemas de Busqueda de Respuesta existentes utilizan diferentes técnicas para el tratamiento tanto de las preguntas como de los documentos fuente utilizados para realizar dichos procesos. Uno de los aspectos que ha demostrado mayor efectividad es el uso de reconocedores de entidades nombradas en diferentes niveles del proceso de BR. Una entidad nombrada (EN) es una palabra, o un sintagma que denota un objeto que puede caer en una de las siguientes categorías generales: persona, organización, lugar, fecha, cantidad.
Hablando de forma general, el uso de las EN en sistemas de BR comienza a partir del análisis de la pregunta, al asociar a la pregunta en turno la clase semántica esperada como respuesta. Es decir, dada una pregunta determinar si esta requiere como respuesta una EN de clase persona, fecha, etc. Entonces el proceso de extracción de fragmentos respuesta se realiza con base en la ocurrencia de EN de la clase semántica esperada como respuesta dentro del fragmento de texto analizado.
Otras aproximaciones utilizan la identificación de EN para establecer tripletas semánticas formadas por una entidad, el rol semántico que dicha entidad desempeña y el término con el que dicha entidad mantiene la relación.
En contraparte a la identificación de EN en tiempo de búsqueda, Prager ha presentado una aproximación conocida como "Anotación Predictiva". Dicha aproximación recae en tres componentes: Anotación predictiva, análisis de la pregunta y selección de la respuesta. La anotación predictiva consiste en analizar los documentos en la colección de entrada en busca de palabras que se cree puedan ser respuestas a posibles preguntas. Entonces el sistema les asigna etiquetas que indican el tipo de preguntas que pueden responder. Las etiquetas incluyen lugares, personas, duración, día y longitud. El análisis de la pregunta consiste en utilizar una variedad de tipos de pregunta estándar en los cuales se reemplazan ciertas palabras por las etiquetas adecuadas
![Validate my RSS feed [Valid RSS]](imagenes/valid-rss.png)