Abstract

En este Trabajo de Fin de Grado (TFG) se investiga el desarrollo de estrategias de control de la dinámica de grupos de agentes que siguen el efecto Flocking (efecto manada), caracter¿¿stico de fenómenos como los cardúmenes de peces, los rebaños de ovejas o las bandadas de pájaros, utilizando técnicas de aprendizaje por refuerzo (RL). En primer lugar, se implementa un algoritmo básico de Flocking para generar grupos con estas dinámicas, que posteriormente se utiliza en los entornos de entrenamiento. A continuación, se desarrolla una implementación abstracta de varios algoritmos de aprendizaje por refuerzo, adaptada a entornos compatibles con la interfaz de la librer¿¿a Gym. Los algoritmos implementados pertenecen a las ramas de gradiente de pol¿¿ticas y actor-cr¿¿tico, espec¿¿ficamente REINFORCE y A2C. Finalmente, se diseñan diversos entornos donde estos algoritmos son aplicados y evaluados me- diante diferentes métricas. Se consideran dos tipos de control: un control predatorio, en el que los agentes huyen de un agente externo, y un control indirecto, donde un agente intenta influir en la dinámica del grupo para dirigirlo.
Loading...

Quotes

plumx
0 citations in WOS
0 citations in

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad Rey Juan Carlos

URL external

DOI

Description

Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2024/2025. Directores/as: David Gualda Gómez

Citation

Endorsement

Review

Supplemented By

Referenced By

Statistics

Views
0
Downloads
0

Bibliographic managers

Document viewer

Select a file to preview:
Reload