ENTRENAMIENTO DE RED NEURONAL PARA GENERACIÓN DE AVATARES HUMANOS A PARTIR DE LENGUAJE NATURAL

Fecha

2024-06-28

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Rey Juan Carlos

Resumen

Los modelos generativos de inteligencia artificial nos ofrecen un vasto repertorio de herramientas capaces de ejecutar tareas complejas en una fracción del tiempo que requeriría un ser humano. Entre estos, los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) destacan por su habilidad para generar textos de gran diversidad, desde narrativas literarias hasta respuestas especializadas en distintos campos del conocimiento, emulando la competencia de un experto en la materia. Sin embargo, el potencial de los LLMs puede expandirse aún más allá: estos modelos pueden ser utilizados como un método de comunicación directa entre personas y computadoras, creando un tipo de idioma entre humano y máquina. En este escenario, un comando emitido en lenguaje natural podría ser interpretado por la red neuronal para realizar tareas específicas basadas en patrones previamente entrenados. Este proyecto explora precisamente esa posibilidad, utilizando un LLM reentrenado para identificar descripciones físicas de personas y crear representaciones precisas de avatares utilizando el modelo SMPL-X. Este enfoque no solo promete mejorar la interacción humano-máquina, sino que también abre nuevas vías para la personalización y la simulación en entornos virtuales. El desarrollo de este proyecto enfrenta una serie de desafíos notables. En primer lugar, para que el sistema sea capaz de identificar correctamente los distintos atributos físicos de un cuerpo humano y relacionarlos con las correspondientes variables en el modelo de malla, es esencial contar con un dataset extenso y diversificado que proporcione una base sólida para el entrenamiento de la red neuronal. Además, es crucial adaptar el tamaño y la complejidad del modelo a los recursos disponibles; un modelo excesivamente grande podría resultar ineficaz en un computador personal o podría generar tiempos de ejecución demasiado largos para un proyecto de esta envergadura. Por último, es fundamental que los resultados obtenidos sean precisos y confiables. La representación generada debe ser fiel a la descripción proporcionada, ofreciendo una respuesta rápida que maximice las ventajas de usar LLMs, haciendo de esta tecnología una herramienta superior en comparación con los métodos manuales tradicionales, lo que resulta en una mejora significativa en la eficiencia y efectividad de la interacción humano-máquina.

Descripción

Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: Dan Casas Guix

Citación

license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Creative Commons Atribución 4.0 Internacional