Tesis - Maestría en Ciencias de la Computación
Permanent URI for this collection
Browse
Browsing Tesis - Maestría en Ciencias de la Computación by browse.metadata.advisor "Barrios Aranibar, Dennis"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
Item (Delta) - radius IVRL: paradigma de integración de aprendizaje por refuerzo en sistemas multi-agente(Universidad Católica San Pablo, 2016) Camargo Monroy, Jesús Alejandro; Barrios Aranibar, DennisLos sistemas multi-agente han mostrado, por su propia naturaleza, permitir resolver problemas que requieren coordinación y/o cooperación, ello por cuanto permiten representar de forma natural dichas situaciones. Sin embargo, existen algunos problemas relacionados a su representación formal y en consecuencia a su aplicación. El estudio de los modelos formales actuales ha dejado al descubierto algunas de las falencias respecto a su representación y aplicación; con un fallido sistema de comunicación como el problema mayor comúnmente encontrado. Estando al tanto de este problema proponemos : δ-radius Communication Model, una representación formal para la comunicación en sistemas multi-agentes. Los paradigmas dominantes de aprendizaje en el área son Independent Learning e Influence Value Reinforcement Learning. Polos opuestos en relación a la influencia de los agentes respecto a sus compañeros. Independent Learning busca establecer un sistema libre de influencia; mientras tanto, Influence Value Reinforcement Learning presenta un escenario en el cual los agentes son influenciados por todos sus compañeros en un entorno compartido. Basándonos en ambos extremos, una vista unificada de ambos paradigmas es definida: δ-radius Influence Value Reinforcement Learnig. La visión unificada ha de permitir el desarrollo de sistemas intermedios, en los cuales se pueda definir limitaciones explícitas a la comunicación mediante una noción de distancia entre los agentes y teniendo como limitante a δ, una variable que determinara la distancia máxima bajo la cual es posible establecer comunicación entre dos agentes. Más aún, los resultados de los experimentos desarrollados han demostrado que los sistemas intermedios han de tener una menor complejidad algorítmica y una mejor capacidad de convergencia.Item Generación de marcha de un robot humanoide imitando al ser humano(Universidad Católica San Pablo, 2019) Cornejo Arismendi, Victor Alfonzo; Barrios Aranibar, DennisEsta investigación plantea el problema de generar una marcha para un robot humanoide a partir de la imitación de un ser humano, para ello, la información cinemática capturada del movimiento humano es utilizada y aplicada en la propuesta basada en una primera etapa en el mapeo desde los puntos de captura del movimiento humano hasta las articulaciones de robots humanoides, y en una segunda etapa de aprendizaje desde la generación de pequeñas perturbaciones de los movimientos mapeados hasta el entrenamiento del modelo de aprendizaje, con el fin de ajustar las posiciones de las articulaciones del humanoide para imitar el movimiento humano. La investigación muestra el estado del arte de trabajos relacionados y plantea una clasificación diferenciando entre técnicas con y sin imitación. La propuesta muestra un esquema que toma la secuencia de una marcha humana y la réplica en un robot humanoide usando un algoritmo de mapeamiento. Estos resultados no son suficientes, ya que la réplica de movimientos no resuelve el problema de equilibrio. Por ello se plantea utilizar algoritmo de aprendizaje por refuerzo que utiliza posibles acciones a cada paso y las interpola en esta red neuronal. Esta red utiliza una función de recompensa que esta´ dada por el ángulo de desviación del torso que mide la estabilidad del robot. Así también se muestran graficas de convergencia de la propuesta con distintos resultados usando diferentes parámetros de prueba para encontrar los parámetros indicados de convergencia. También se propone una medida de similitud entre el resultado de la propuesta y el movimiento real humano. Concluyendo en un análisis de resultados satisfactorios y propuestas de futuras aplicaciones.