ESTUDIO DEL APRENDIZAJE POR REFUERZO CON REDES NEURONALES PARA PERSUADIR A AGENTES A ACTUAR SIGUIENDO VALORES

Resumen

En este trabajo de fin de grado se utilizarán técnicas de aprendizaje por refuerzo profundo con el objetivo de persuadir a agentes a actuar en un entorno simulado de impuestos. El objetivo es que aprendan políticas de decisión que promuevan determinados valores tales como la riqueza propia o la igualdad entre todos los miembros de la sociedad. Para ello, se implementará el entorno que simula la sociedad fiscal, se entrenarán distintos modelos mediante el algoritmo DQN y se realizarán validaciones que comprueben si las políticas obtenidas consiguen sus objetivos.

Descripción

Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: Holger Billhardt

Citación