Multiagent reinforcement learning using Non-Parametric Approximation

n este artículo se presenta una propuesta hibrida de algoritmo de control para sistemas multiagentes, en donde se aprovechan las ventajas del aprendizaje por reforzamiento y de las funciones de aproximación no paramétricas. Se utiliza una versión modificada del algoritmo Q-learning la cual proveerá...

Full description

Saved in:
Bibliographic Details
Main Author: Luviano Cruz, David
Other Authors: Garcia Luna, Francesco Jose, Perez Dominguez, Luis Asuncion
Format: Artículo
Language:spa
Published: 2019
Subjects:
Online Access:https://doi.org/10.22463/0122820X.1738
https://revistas.ufps.edu.co/index.php/respuestas/article/view/1738
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:n este artículo se presenta una propuesta hibrida de algoritmo de control para sistemas multiagentes, en donde se aprovechan las ventajas del aprendizaje por reforzamiento y de las funciones de aproximación no paramétricas. Se utiliza una versión modificada del algoritmo Q-learning la cual proveerá de datos de entrenamiento para un Kernel, el cual ofrecerá una aproximación sub optima de acciones a realizar por los agentes. El algoritmo propuesto es probado experimentalmente en una tarea de generación de trayectoria en un entorno desconocido para robot móviles