A new insight into linguistic pattern analysis based on multilayer hypergraphs for the automatic extraction of text summaries
Résumé
La lingüística forense y la estilometría tienen en la exploración de patrones lingüísticos una de sus herramientas fundamentales. Estructuras matemáticas como las redes multicapa y los hipergrafos proporcionan recursos notables para representar y analizar textos. En este trabajo, presentamos un modelo que incluye algunas relaciones mesoscópicas específicas entre los distintos tipos de palabras de un corpus (palabras léxicas, verbos, palabras de enlace, otras palabras) en función de las frases o párrafos en los que aparecen. Este modelo se apoya en diversas estructuras matemáticas, como los hipergrafos multicapa y sus grafos derivados. La metodología propuesta desde este nuevo punto de vista es de singular ayuda para encontrar frases significativas de cualquier texto, establecer un resumen automático del mismo y, eventualmente, determinar su nivel lingüístico.
Description
This work has been partially supported by projects PGC2018-101625-B-I00 (Spanish Ministry, AEI/FEDER, UE) and M1967 Grant (Rey Juan Carlos University, Spain). The authors acknowledge the usage of the resources, technical expertise, and assistance provided by the supercomputer facility CRESCO of ENEA in Portici (Italy).
Colecciones
- Artículos de Revista [4552]