Fernández Jiménez, Guillermo2024-05-162024-05-162024-05-16https://hdl.handle.net/10115/32915Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: Holger BillhardtEn este trabajo de fin de grado se utilizarán técnicas de aprendizaje por refuerzo profundo con el objetivo de persuadir a agentes a actuar en un entorno simulado de impuestos. El objetivo es que aprendan políticas de decisión que promuevan determinados valores tales como la riqueza propia o la igualdad entre todos los miembros de la sociedad. Para ello, se implementará el entorno que simula la sociedad fiscal, se entrenarán distintos modelos mediante el algoritmo DQN y se realizarán validaciones que comprueben si las políticas obtenidas consiguen sus objetivos.spaDQNRed neuronalQ-NetworkQ-LearningSociedad fiscalAgentes inteligentesPolíticaAprendizaje automáticoESTUDIO DEL APRENDIZAJE POR REFUERZO CON REDES NEURONALES PARA PERSUADIR A AGENTES A ACTUAR SIGUIENDO VALORESinfo:eu-repo/semantics/studentThesisinfo:eu-repo/semantics/embargoedAccess