Abstract
En este artículo se propone un enfoque innovador para analizar el lenguaje de especialidad matemático, concretamente el utilizado en los textos científicos relacionados con la teoría de redes complejas. Para ello, se construye un modelo basado en redes complejas multicapa que permite estudiar cómo se combinan las palabras dentro de un corpus técnico, poniendo especial atención en las colocaciones (combinaciones estables de dos términos, como “complex network”), que constituyen la base terminológica de los lenguajes especializados.
El corpus analizado está compuesto por 86 artículos y resúmenes extendidos, con un total de más de 147.000 palabras, publicados en el International Journal of Complex Systems in Science entre 2011 y 2016. A partir de este corpus, se crea una red lingüística en la que cada palabra es un nodo y cada coocurrencia entre dos palabras consecutivas constituye un enlace dirigido y ponderado según su frecuencia.
El modelo distingue cuatro capas: una capa léxica, que incluye sustantivos y adjetivos propios del ámbito matemático; una capa de verbos; una capa de palabras de enlace, como preposiciones o conectores; una de otras palabras, que agrupa vocabulario común no especializado o perteneciente a otros ámbitos.
Esta clasificación refleja distintos niveles de especialización y permite observar cómo interactúan las unidades lingüísticas en textos científicos.
Para medir la relevancia de palabras y colocaciones, se emplea el algoritmo PageRank, adaptado a redes dirigidas y ponderadas. Además, se utiliza el concepto de line graph, mediante el cual los enlaces se transforman en nodos, lo que permite calcular el PageRank de las colocaciones.
Una de las contribuciones centrales del estudio es el análisis de sensibilidad: se manipulan artificialmente los pesos de las conexiones en una capa (por ejemplo, las colocaciones léxicas) mediante un parámetro α, que multiplica la frecuencia de los enlaces. Esto permite simular escenarios en los que las colocaciones aparecen más o menos frecuentemente y observar hasta qué punto cambian los rankings de importancia de las palabras y colocaciones.
Los resultados muestran de forma contundente que las colocaciones son mucho más sensibles a cambios en la intensidad de su aparición que las palabras aisladas. Mientras que el PageRank de palabras individuales se mantiene relativamente estable, el ranking de colocaciones sufre alteraciones significativas incluso con pequeñas variaciones de α. Esto indica que las colocaciones son elementos estructuralmente críticos en los textos especializados y que su presencia (o ausencia) afecta directamente al carácter técnico del lenguaje.
El estudio concluye que este enfoque, basado en redes complejas, ofrece una herramienta poderosa para la traducción especializada, la lexicografía, el aprendizaje de lenguas y el procesamiento automático del lenguaje. Dado que las colocaciones constituyen la verdadera base del significado especializado, identificarlas y entender su comportamiento es esencial para mantener la coherencia terminológica y la precisión semántica en textos científicos.
Journal Title
Journal ISSN
Volume Title
Publisher
Elsevier
URL external
Date
Description
Keywords
Citation
Criado-Alonso, Á., Battaner-Moro, E., Aleja, D., Romance, M., & Criado, R. (2021). Enriched line graph: A new structure for searching language collocations. Chaos, Solitons & Fractals, 142, 110509.



