Revista de Tecnología de la Información e Ingeniería de Software

Revista de Tecnología de la Información e Ingeniería de Software
Acceso abierto

ISSN: 2165- 7866

abstracto

Resumen de texto en amhárico para noticias publicadas en redes sociales

Abaynew Guadie*, Debela Tesfaye, Teferi Kebebew

Este documento presenta el resumen de texto en amhárico para noticias publicadas en redes sociales, para resumir la las noticias publicaron textos en amárico y documentos de las redes sociales en Twitter y Facebook; El principal Los problemas de los textos publicados en las redes sociales son que la mayoría de las personas probablemente leerían que están publicados en textos en amárico. con duplicado de documentos contabilizados. Sin embargo, para encontrar la información que el usuario está buscando para encontrar el resumen publicado textos y leer partes importantes de las publicaciones como documentos en amárico para extraer la información deseada en las redes sociales. El resumen se ocupa de la sobrecarga de información que presenta y publica con un documento de texto para el actual tiempo de representación de los documentos publicados para resumir. Nuestro enfoque propuesto tiene tres componentes principales: Primero, calcule la similitud entre cada documento publicado dentro de los dos pares de oraciones. En segundo lugar, la agrupación basado en los resultados de similitud de los documentos para agruparlos usando el algoritmo Kmeans. Tercero, resumiendo el documento publicado agrupado individualmente utilizando algoritmos TF-IDF que implican encontrar formas estadísticas para el frecuente términos para clasificar los documentos. Aplicamos la técnica de resumen es un enfoque de resumen extractivo que se le asigna un extracto de las oraciones con las oraciones mejor clasificadas en los documentos publicados para formar el resúmenes y el tamaño del resumen pueden ser identificados por el usuario. En el experimento uno, la puntuación más alta de la medida F es del 87,07% para la tasa de extracción al 30%, en el grupo agrupado de puestos de protesta. En el segundo experimento, la mayor La puntuación de la medida F es del 84 % para una tasa de extracción del 30 %, en grupos posteriores a sequías. En el tercer experimento, la mayor La puntuación de la medida F es del 91,37 % para una tasa de extracción del 30 %, en los grupos de publicaciones deportivas y también en el cuarto experimento la puntuación más alta de la medida F es del 93,52 % para la tasa de extracción del 30 % para generar los textos de publicación de resumen. Si el sistema para generar se aumenta el tamaño del resumen, también se aumenta la tasa de extracción en los textos publicados. Para esto, el sistema de evaluación ha demostrado que muy buenos resultados para resumir los textos publicados en las redes sociales.

Top