Abstract
En este Trabajo de Fin de Grado (TFG) se investiga el desarrollo de estrategias de control
de la dinámica de grupos de agentes que siguen el efecto Flocking (efecto manada), caracter¿¿stico
de fenómenos como los cardúmenes de peces, los rebaños de ovejas o las bandadas de pájaros,
utilizando técnicas de aprendizaje por refuerzo (RL).
En primer lugar, se implementa un algoritmo básico de Flocking para generar grupos con estas
dinámicas, que posteriormente se utiliza en los entornos de entrenamiento. A continuación, se
desarrolla una implementación abstracta de varios algoritmos de aprendizaje por refuerzo, adaptada
a entornos compatibles con la interfaz de la librer¿¿a Gym. Los algoritmos implementados pertenecen
a las ramas de gradiente de pol¿¿ticas y actor-cr¿¿tico, espec¿¿ficamente REINFORCE y A2C.
Finalmente, se diseñan diversos entornos donde estos algoritmos son aplicados y evaluados me-
diante diferentes métricas. Se consideran dos tipos de control: un control predatorio, en el que los
agentes huyen de un agente externo, y un control indirecto, donde un agente intenta influir en la
dinámica del grupo para dirigirlo.
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Rey Juan Carlos
URL external
DOI
Date
Description
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2024/2025. Directores/as: David Gualda Gómez
Keywords
Citation
Collections
Endorsement
Review
Supplemented By
Referenced By
Document viewer
Select a file to preview:
Reload



