Enriched line graph: A new structure for searching language collocations

dc.contributor.authorCriado-Alonso, Angeles
dc.contributor.authorBattaner-Moro, Elena
dc.contributor.authorAleja, David
dc.contributor.authorRomance, Miguel
dc.contributor.authorCriado, Regino
dc.date.accessioned2026-03-02T08:59:11Z
dc.date.issued2020-11-28
dc.description.abstractEn este artículo se propone un enfoque innovador para analizar el lenguaje de especialidad matemático, concretamente el utilizado en los textos científicos relacionados con la teoría de redes complejas. Para ello, se construye un modelo basado en redes complejas multicapa que permite estudiar cómo se combinan las palabras dentro de un corpus técnico, poniendo especial atención en las colocaciones (combinaciones estables de dos términos, como “complex network”), que constituyen la base terminológica de los lenguajes especializados. El corpus analizado está compuesto por 86 artículos y resúmenes extendidos, con un total de más de 147.000 palabras, publicados en el International Journal of Complex Systems in Science entre 2011 y 2016. A partir de este corpus, se crea una red lingüística en la que cada palabra es un nodo y cada coocurrencia entre dos palabras consecutivas constituye un enlace dirigido y ponderado según su frecuencia. El modelo distingue cuatro capas: una capa léxica, que incluye sustantivos y adjetivos propios del ámbito matemático; una capa de verbos; una capa de palabras de enlace, como preposiciones o conectores; una de otras palabras, que agrupa vocabulario común no especializado o perteneciente a otros ámbitos. Esta clasificación refleja distintos niveles de especialización y permite observar cómo interactúan las unidades lingüísticas en textos científicos. Para medir la relevancia de palabras y colocaciones, se emplea el algoritmo PageRank, adaptado a redes dirigidas y ponderadas. Además, se utiliza el concepto de line graph, mediante el cual los enlaces se transforman en nodos, lo que permite calcular el PageRank de las colocaciones. Una de las contribuciones centrales del estudio es el análisis de sensibilidad: se manipulan artificialmente los pesos de las conexiones en una capa (por ejemplo, las colocaciones léxicas) mediante un parámetro α, que multiplica la frecuencia de los enlaces. Esto permite simular escenarios en los que las colocaciones aparecen más o menos frecuentemente y observar hasta qué punto cambian los rankings de importancia de las palabras y colocaciones. Los resultados muestran de forma contundente que las colocaciones son mucho más sensibles a cambios en la intensidad de su aparición que las palabras aisladas. Mientras que el PageRank de palabras individuales se mantiene relativamente estable, el ranking de colocaciones sufre alteraciones significativas incluso con pequeñas variaciones de α. Esto indica que las colocaciones son elementos estructuralmente críticos en los textos especializados y que su presencia (o ausencia) afecta directamente al carácter técnico del lenguaje. El estudio concluye que este enfoque, basado en redes complejas, ofrece una herramienta poderosa para la traducción especializada, la lexicografía, el aprendizaje de lenguas y el procesamiento automático del lenguaje. Dado que las colocaciones constituyen la verdadera base del significado especializado, identificarlas y entender su comportamiento es esencial para mantener la coherencia terminológica y la precisión semántica en textos científicos.
dc.identifier.citationCriado-Alonso, Á., Battaner-Moro, E., Aleja, D., Romance, M., & Criado, R. (2021). Enriched line graph: A new structure for searching language collocations. Chaos, Solitons & Fractals, 142, 110509.
dc.identifier.doi10.1016/j.chaos.2020.110509
dc.identifier.urihttps://hdl.handle.net/10115/182297
dc.language.isoen
dc.publisherElsevier
dc.rights.accessRightsinfo:eu-repo/semantics/closedAccess
dc.subjectEnriched line graph
dc.subjectRedes Multicapa
dc.subjectPageRank
dc.subjectColocaciones de Lenguaje
dc.titleEnriched line graph: A new structure for searching language collocations
dc.typeArticle

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Name:
ARTICULOCAOS 2021.pdf
Size:
1.36 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Name:
license.txt
Size:
2.96 KB
Format:
Item-specific license agreed upon to submission
Description: