Examinando por Autor "Hidalgo-Ternero, Carlos Manuel"
Mostrando 1 - 2 de 2
- Resultados por página
- Opciones de ordenación
Ítem En torno a la traducción automática neuronal de zoologismos(Peter Lang, 2024-09) Zhou-Lian, Xiaoqing; Corpas Pastor, Gloria; Hidalgo-Ternero, Carlos ManuelLa reciente aparición de los sistemas neuronales ha supuesto una auténtica revolución en el ámbito de la traducción automática, dando lugar a la traducción automática neuronal (TAN), que supone un enorme salto cualitativo en comparación con el predecesor sistema de traducción automática estadística basada en segmentos o frases (phrase-based statistical machine translation o PBSMT) (Bojar et al., 2016; Castilho et al., 2017; Sennrich et al., 2016). A pesar de estos avances, los sistemas TAN aún tienen un importante talón de Aquiles —las unidades fraseológicas— debido principalmente a los múltiples desafíos que estas presentan: ambigüedad, no composicionalidad, manipulación, variación diasistemática, flexibilidad morfosintáctica, discontinuidad, o anisomorfismo interlingüístico, entre otros. En este contexto, en el presente trabajo analizaremos las principales dificultades que supone la traducción automática neuronal de distintos zoologismos (es decir, unidades fraseológicas que contienen lexemas referidos a nombres de animales [denominados zoónimos]) tales como pagar el pato, llevarse el gato al agua, haber gato encerrado, dar gato por liebre o [ser] cuatro gatos, en las direccionalidades de traducción ES>EN/ZH. Para ello, examinaremos el rendimiento de los dos sistemas de traducción automática neuronal más robustos del mercado: DeepL y Google Translate. Con este telón de fondo, los prometedores resultados obtenidos con zoologismos podrán abrir camino hacia nuevas formas de optimizar el tratamiento de las unidades fraseológicas por parte de los sistemas TAN.Ítem gApp: a text preprocessing system to improve the neural machine translation of discontinuous multiword expressions(2023-09) Hidalgo-Ternero, Carlos Manuel; Zhou-Lian, XiaoqingIn this paper we present research results with gApp, a text-preprocessing system designed for automati-cally detecting and converting discontinuous multiword expressions (MWEs) into their continuous forms so as to improve the performance of current neural machine translation systems (NMT) (see Hidalgo-Ternero, 2021 & 2022, Hidalgo-Ternero & Corpas Pastor, 2020, 2022a & 2022b, Hidalgo-Ternero, Lista, and Corpas Pastor, 2022, and Hidalgo-Ternero and Zhou-Lian, 2022a & 2022b). To test its effectiveness, eight experiments with several NMT systems such as DeepL, Google Translate, ModernMT and VIP have been carried out in different language directionalities (ES/FR/IT > ES/EN/DE/FR/IT/PT/ZH) for the trans-lation of somatisms, i.e., MWEs containing lexemes referring to human or animal body parts (Mellado Blanco, 2004). More specifically, we have analysed both flexible verb-noun idiomatic constructions (VNICs) and flexible verb + prepositional phrase (VPP) constructions. In this regard, the promising results obtained for these typologies of MWEs throughout experiments 1-8 will shed some light on new avenues for enhancing MWE-aware NMT systems.