Revista de Tecnología de la Información e Ingeniería de Software

Revista de Tecnología de la Información e Ingeniería de Software
Acceso abierto

ISSN: 2165- 7866

abstracto

CONDENZA: un sistema para extraer resúmenes de un documento fuente dado

Mgbeafulike IJ y Christopher Ejiofor

A pesar de la creciente disponibilidad de documentos en formato electrónico y la disponibilidad de software de autoedición, los resúmenes continúan produciéndose manualmente. El propósito de CONDENZA es desarrollar un sistema para la extracción de resúmenes a partir de un documento fuente determinado. CONDENZA describe un sistema de métodos automáticos de obtención de resúmenes. La razón de ser de los resúmenes es facilitar la identificación rápida y precisa del tema de los artículos publicados. La idea es ahorrarle tiempo y esfuerzo a un posible lector para encontrar información útil en un artículo o informe dado. El sistema genera una versión más corta de una oración dada mientras intenta preservar su significado. Esta tarea se lleva a cabo utilizando técnicas de resumen. CONDENZA implementa un método que combina un algoritmo a priori para la detección de frecuencia de palabras clave con un enfoque basado en agrupamiento para agrupar oraciones similares. El resultado del sistema muestra que nuestro enfoque ayuda a resumir los documentos de texto de manera eficiente al evitar la redundancia entre las palabras del documento y garantiza la máxima relevancia para el texto de entrada. Los factores rectores de nuestros resultados son la proporción de oraciones de entrada a salida después del resumen.

Top