Abstract
Material docente en abierto de la asignatura Procesamiento del Lenguaje Natural I, impartida en el Grado en Inteligencia Artificial de la Universidad Rey Juan Carlos. Su propósito es ofrecer una formación integral que combina fundamentos teóricos del procesamiento del lenguaje natural con una orientación eminentemente práctica.
El contenido se organiza en seis bloques complementarios. La guía de estudio establece objetivos, competencias, planificación semanal y recomendaciones. Los apuntes desarrollan el contenido teórico de los conceptos de procesamiento del lenguaje natural abordados, mientras que las diapositivas sintetizan los conceptos clave. Los ejercicios plantean actividades para aplicar los conceptos presentados, incluyendo pruebas de convocatorias previas. Los vídeos ofrecen un apoyo guiado para la resolución de los ejercicios propuestos, conectando los conceptos requeridos con su resolución práctica. Finalmente, el repositorio de software en abierto reúne notebooks, datos, modelos y dependencias para reproducir las soluciones de los ejercicios.
La asignatura presenta, de forma progresiva, los fundamentos del procesamiento del lenguaje natural junto con su aplicación práctica. Comienza con una introducción a este campo y su importancia. Continúa con el preprocesamiento y los niveles de análisis lingüístico, junto con el uso de recursos lingüísticos. A continuación, se estudian los principales modelos y técnicas de representación del texto. Sobre esta base, se introducen arquitecturas neuronales aplicadas al procesamiento del lenguaje natural. Posteriormente, se profundiza en la arquitectura Transformer y su aplicación en la actualidad. Finalmente, se presentan técnicas de aumento de datos y la tarea de reconocimiento de entidades nombradas.
El enfoque docente combina teoría con práctica. Cada bloque teórico se acompaña de ejercicios y notebooks reproducibles con herramientas y librerías de procesamiento del lenguaje natural. De este modo, el estudiante no solo comprende sus fundamentos, sino que también desarrolla la capacidad de resolver problemas reales de análisis y procesamiento de texto.
El contenido incluido en este depósito contiene los siguientes materiales:
- libro.pdf: documento docente que integra y organiza los materiales de la asignatura.
- fuentes.zip: archivos fuente utilizados para la elaboración y edición del documento docente anterior.
- software.zip: depósito de software utilizado en la asignatura, distribuido bajo licencia GPLv3 y archivado en Software Heritage.
Más información sobre el depósito software se encuentra disponible en el archivo README.md incluido en él.
> SWHID: swh:1:dir:0af2971bf26fe097520bb46bd6283e07d784982f
> Repositorio: https://github.com/madrueno/urjc-gia-pln-i
Journal Title
Journal ISSN
Volume Title
Publisher
URL external
DOI
Date
Description
Citation
Collections
Endorsement
Review
Supplemented By
Referenced By
Document viewer
Select a file to preview:
Reload



