A new insight into linguistic pattern analysis based on multilayer hypergraphs for the automatic extraction of text summaries

Resumen

La lingüística forense y la estilometría tienen en la exploración de patrones lingüísticos una de sus herramientas fundamentales. Estructuras matemáticas como las redes multicapa y los hipergrafos proporcionan recursos notables para representar y analizar textos. En este trabajo, presentamos un modelo que incluye algunas relaciones mesoscópicas específicas entre los distintos tipos de palabras de un corpus (palabras léxicas, verbos, palabras de enlace, otras palabras) en función de las frases o párrafos en los que aparecen. Este modelo se apoya en diversas estructuras matemáticas, como los hipergrafos multicapa y sus grafos derivados. La metodología propuesta desde este nuevo punto de vista es de singular ayuda para encontrar frases significativas de cualquier texto, establecer un resumen automático del mismo y, eventualmente, determinar su nivel lingüístico.

Descripción

This work has been partially supported by projects PGC2018-101625-B-I00 (Spanish Ministry, AEI/FEDER, UE) and M1967 Grant (Rey Juan Carlos University, Spain). The authors acknowledge the usage of the resources, technical expertise, and assistance provided by the supercomputer facility CRESCO of ENEA in Portici (Italy).

Citación

Math. Meth. Appl. Sci.. 2023;1–18
A new insight into linguistic pattern analysis based on multilayer hypergraphs for the automatic extraction of text summaries Ángeles Criado-Alonso, David Aleja, Miguel Romance, Regino Criado First published: 13 March 2023 https://doi.org/10.1002/mma.9201
license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial 4.0 Internacional