Extracción y Recuperación de la Información I

Universidad Carlos III de Madrid

Introducción a la extracción de información.

Los conceptos de recuperación y extracción de la información puede parecer lo mismo pero no lo son exactamente. Veamos las diferencias.

Recuperación de Información (RI): Determinar cuales son los documentos de una colección que satisfacen una “necesidad de información” de un usuario.

Extracción de Información (EI): Localizar las porciones de texto que contengan información relevante para una necesidades concretas de un usuario/s y proporcionar dicha información de forma adecuada para su proceso (de forma manual o automática).

Para poder crear un sistema de extracción de información, primero un sistema de recuperación de la información obtiene documentos con información significativa respecto a la solicitud de búsqueda y a continuación el sistema de extracción de información extrae y organiza la información que sea de interés.

 

Patrones de extracción de la información.

Debido al enorme volumen de datos, que además se incrementan cada minuto, es muy complicado poder recuperar información relevante. Y se consideran relevantes las páginas que son capaces de satisfacer una necesidad de información del usuario. Para que los buscadores sean capaces de recuperar páginas con información relevante han de extraer la información clave. Por lo tanto la recuperación y la extracción de la información están relacionadas. No pudiéndose recuperar páginas relevantes de las que no se haya extraído antes los datos clave.

Los criterios de extracción de los datos son:

Página creada por Raúl Olías Beltrán

Última Actualización: 29-03-2007

Extracción de Información, valida XHTML 1.0 Extracción de Información, valida css Extracción de Información, WAI - AA Nivel de conformidad Extracción de Información TAW. Nivel doble A. WCAG 1.0 WAI Extracción de Información, Cynthia Tested