Tesis - Maestría en Ciencias de la Computación
Permanent URI for this collection
Browse
Browsing Tesis - Maestría en Ciencias de la Computación by Description "Trabajo de investigación"
Now showing 1 - 15 of 15
Results Per Page
Sort Options
Item Actionable emotion detection in context-aware systems(Universidad Católica San Pablo, 2018) Suni Lopez, Franci; Condori Fernandez, NellyEnsuring the quality of user experience is very important for increasing the acceptance likelihood of software applications, which can be affected by several contextual factors that can continuously change over time (e.g., emotional status of end-user). Due to these changes in the context, software continually needs to be (self-) adaptive for delivering software services that can satisfy user needs continuously. So far, online explicit user feedback has become one of the most used information sources for evaluating users’ satisfaction and discovering new requirements of a given software application. However, most of these online reviews are not authenticated, and they may not always be reliable. In order to complement this explicit feedback derived from user reviews, this research proposes an approach that exploits both physiological and contextual data to be used as main inputs for detecting actionable emotions. These actionable emotions, detected during the user interaction with context-aware software applications, can be used as implicit feedback for improving the adaptability of the software and quality of the user experience. The evaluation involved in total 23 subjects in three rounds of experiments. The results of this research support the idea that emotional data expressed by users when interacting with service-based applications can be used as implicit feedback.Item Automatic interpretation of map visualizations with color-encoded scalar values from bitmap images(Universidad Católica San Pablo, 2018) Mayhua Quispe, Angela Gabriela; Poco Medina, Jorge LuisMap visualizations are used in diverse domains to show geographic data (e.g., climate research, oceanography, business analyses, etc.). These visualizations can be found in news articles, scientific papers, and on the Web. However, many map visualizations are available only as bitmap images, hindering machine interpretation of the visualized data for indexing and reuse. In this work, we propose a pipeline to recover the visual encodings from bitmap images of geographic maps with color-encoded scalar values. We evaluate our results using map images from scientific documents, achieving high accuracy along each step of the pipeline. In addition, we present iGeoMap, our web-based system that uses the extracted visual encoding to enable user-interaction over bitmap images of map visualizations.Item Deep neural networks based on gating mechanism for open-domain question answering(Universidad Católica San Pablo, 2018) Arch Tijera, Drake Christian; Ochoa Luna, José EduardoNowadays, Question Answering is being addressed from a reading comprehension approach. Usually, Machine Comprehension models are poweredby Deep Learning algorithms. Most related work faces the challenge by improving the Interaction Encoder, proposing several architectures strongly based on attention. In Contrast, few related work has focused on improving the Context Encoder. Thus, our work has explored in depth the Context Encoder. We propose a gating mechanism that controls the ow of information, from the Context Encoder towards Interaction Encoder. This gating mechanism is based on additional information computed previously. Our experiments has shown that our proposed model improved the performance of a competitive baseline model. Our single model reached 78.36% on F1 score and 69.1% on exact match metric, on the Stanford Question Answering benchmark.Item Detección de eventos anómalos en vídeo(Universidad Católica San Pablo, 2017) Menejes Palomino, Neptalí; Cámara Chávez, GuillermoEn los últimos años, la detección de eventos anómalos en secuencias de video ha atraído una mayor atención en la comunidad de investigación de visión por computador. Esto ha ocurrido debido a la creciente necesidad de utilizar los sistemas de vigilancia automatizados para mejorar la seguridad en los espacios públicos y privados. Si bien se han logrado avances, todavía existen algunas limitaciones en la investigación actual. Es decir, la mayoría de los métodos de la literatura se enfocan en la detección de eventos anómalos específicos, y algunos todavía no son capaces de detectar más de dos tipos de anomalías. En esta investigación, se propone un nuevo modelo para la detección y localización de eventos anómalos en áreas peatonales. El objetivo es diseñar un algoritmo que permita detectar eventos anómalos mediante el uso de la información de movimiento y la apariencia. La información de movimiento se representa a través del uso de la velocidad y la aceleración del flujo óptico, y la información de apariencia es representado mediante la textura y la gradiente del flujo óptico. Para representar estas características se introduce el uso de parches espacio-temporales sin superposición. A diferencia de los métodos de la literatura, el modelo propuesto proporciona una solución general para detectar eventos anómalos tanto globales como locales. Además, en la etapa de detección se presentan problemas de perspectiva, esto debido a que los objetos cercanos a la cámara parecen ser grandes, mientras que los objetos alejados a la cámara parecen ser pequeños.. Para abordar estos problemas, se propone la clasificación por región. Los resultados experimentales sobre dos bases de datos (UCSD y UMN) y la comparación con los métodos de la literatura validan el rendimiento y la robustez del modelo propuesto. Los resultados del método propuesto sobre la base de datos UCSD Peds2 logra un EER de 07.2% y un AUC de 0.977 y en la base de datos UMN se logra un 0.998 de AUC en la escena 1 y 0.995 de AUC en la escena 3, estos resultados superan a los resultados de la literatura. Mientras tanto, los resultados sobre las bases de datos UCSD Peds1 logra un EER de 29.2% y un AUC de 0.792 y en la base de datos UMN escena 2 se logra un 0.948 de AUC, estos resultados son comparables con los resultados de los métodos de la literatura, esto ocurre debido a que estas bases de datos presentan problemas de perspectiva.Item Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales(Universidad Católica San Pablo, 2019) Muñoz Salas, Gina Lucia; Gómez Nieto, ErickLos datos encontrados en conjuntos reales pueden incluir múltiples tipos de datos, como numéricos y categóricos. Encontrar formas de manejar estos diferentes valores se ha convertido en uno de los objetivos actuales de la investigación en minería y visualización de datos. En este trabajo, se ha estudiado las consecuencias de diferentes medidas de similitud de tipo mixto en mapas visuales de datos multidimensionales. El estudio se centra en analizar el impacto de estas medidas combinándolas con técnicas de proyección multidimensionales conocidas, que con frecuencia son la opción al proporcionar un mecanismo visual para descubrir información en espacios multidimensionales. Se aplicó las métricas coeficiente de silueta, preservación del vecindad y coeficiente de estrés en las proyecciones de nueve conjuntos de datos para evaluar las diferentes medidas de distancia, tanto en términos de segregación como de preservación de la similitud. Además, se presenta un estudio de caso sobre datos urbanos que ilustra la necesidad de confiar en tales medidas. Sobre la base de los análisis, proporcionamos recomendaciones sobre la aplicación de medidas de similitud para conjuntos de datos multidimensionales de tipo mixto en tareas de análisis visual.Item Exploración visual basada en similitud de grandes conjuntos de datos multidimensionales georreferenciados(Universidad Católica San Pablo, 2019) Peralta Aranibar, Eddie Rogger; Gomez Nieto, ErickLa visualización de grandes cantidades de datos es una de las principales tareas que realiza un analista de datos. En sistemas tradicionales de manejo de datos, registros de enormes conjuntos de datos no pueden ser consultados por su similitud debido a su complejidad, en términos de volumen y multiplicidad. En esta tesis, proponemos un enfoque efectivo para la indexación de millones de elementos, con el propósito de ejecutar simples y múltiples consultas visuales de similitud sobre datos multidimensionales asociadas a una ubicación geográfica. Nuestro enfoque hace uso del método Z-order curve para mapear nuestro conjunto de datos en una alta dimensionalidad a un espacio de una dimensión considerando la similitud entre los datos. Respaldamos nuestra propuesta mediante la comparación con otros métodos del estado del arte en la literatura, utilizando métricas de preservación de vecindad y analizando las ventajas y desventajas entre estos métodos. Adicionalmente, presentamos un conjunto de resultados usando datos reales de diversas fuentes y analizamos los conocimientos obtenidos a partir de su exploración interactiva.Item GCTW Alignment for isolated gesture recognition(Universidad Católica San Pablo, 2018) Guzmán Zenteno, Leonardo Braulio; Cámara Chávez, GuillermoIn recent years, there has been increasing interest in developing automatic Sign Language Recognition (SLR) systems because Sign Language (SL) is the main mode of communication between deaf people all over the world. However, most people outside the deaf community do not understand SL, generating a communication problem, between both communities. Recognizing signs is a challenging problem because manual signing (not taking into account facial gestures) has four components that have to be recognized, namely, handshape, movement, location and palm orientation. Even though the appearance and meaning of basic signs are well-defined in sign language dictionaries, in practice, many variations arise due to different factors like gender, age, education or regional, social and ethnic factors which can lead to significant variations making hard to develop a robust SL recognition system. This project attempts to introduce the alignment of videos into isolated SLR, given that this approach has not been studied deeply, even though it presents a great potential for correctly recognize isolated gestures. We also aim for a user-independent recognition, which means that the system should give have a good recognition accuracy for the signers that were not represented in the data set. The main features used for the alignment are the wrists coordinates that we extracted from the videos by using OpenPose. These features will be aligned by using Generalized Canonical Time Warping. The resultant videos will be classified by making use of a 3D CNN. Our experimental results show that the proposed method has obtained a 65.02% accuracy, which places us 5th in the 2017 Chalearn LAP isolated gesture recognition challenge, only 2.69% away from the first place.Item Generación de marcha de un robot humanoide imitando al ser humano(Universidad Católica San Pablo, 2019) Cornejo Arismendi, Victor Alfonzo; Barrios Aranibar, DennisEsta investigación plantea el problema de generar una marcha para un robot humanoide a partir de la imitación de un ser humano, para ello, la información cinemática capturada del movimiento humano es utilizada y aplicada en la propuesta basada en una primera etapa en el mapeo desde los puntos de captura del movimiento humano hasta las articulaciones de robots humanoides, y en una segunda etapa de aprendizaje desde la generación de pequeñas perturbaciones de los movimientos mapeados hasta el entrenamiento del modelo de aprendizaje, con el fin de ajustar las posiciones de las articulaciones del humanoide para imitar el movimiento humano. La investigación muestra el estado del arte de trabajos relacionados y plantea una clasificación diferenciando entre técnicas con y sin imitación. La propuesta muestra un esquema que toma la secuencia de una marcha humana y la réplica en un robot humanoide usando un algoritmo de mapeamiento. Estos resultados no son suficientes, ya que la réplica de movimientos no resuelve el problema de equilibrio. Por ello se plantea utilizar algoritmo de aprendizaje por refuerzo que utiliza posibles acciones a cada paso y las interpola en esta red neuronal. Esta red utiliza una función de recompensa que esta´ dada por el ángulo de desviación del torso que mide la estabilidad del robot. Así también se muestran graficas de convergencia de la propuesta con distintos resultados usando diferentes parámetros de prueba para encontrar los parámetros indicados de convergencia. También se propone una medida de similitud entre el resultado de la propuesta y el movimiento real humano. Concluyendo en un análisis de resultados satisfactorios y propuestas de futuras aplicaciones.Item Generación de triangulaciones de Delaunay persistentes(Universidad Católica San Pablo, 2017) Cardenas Choque, Jainor Nestor; López del Alamo, CristianLos algoritmos para generar triangulaciones de Delaunay son ampliamente conocidos y tienen muchas aplicaciones en diversas áreas, como en geometría computacional, astronomía, robótica, cartografía, zoología, entre otros. La presente investigación, propone utilizar conceptos de estructuras espacio-temporales como la persistencia, para diseñar un algoritmo de triangulaciones de Delaunay, de modo que sea factible realizar consultas y modificaciones en un determinado tiempo t minimizando la complejidad espacial y temporal.Item KMesh: un algoritmo paralelo para construir mallas adaptativas a partir de imágenes(Universidad Católica San Pablo, 2018) Gonzales Vega, Ronald Ubel Adolfo; Cuadros Vargas, Alex JesúsCon el desarrollo de métodos de computación gráfica y tecnologías que permiten captar imágenes volumétricas, se abrió´ paso a un desarrollo importante de métodos para generar modelos geométricos, entre ellos, se encuentra el método Imesh, el cual es un algoritmo que construye mallas simpliciales a partir de imágenes no pre procesadas, en 2 y 3 dimensiones. Imesh está´ dividido en 3 etapas: Construcción (ImeshCm), de una malla de Delaunay a partir de una imagen de entrada; Particionamiento (ImeshPm), de la malla en un número definido de submallas, usando su información geométrica y topológica; y Mejoramiento (ImeshMm), de los elementos que componen las submallas generadas introduciendo criterios de calidad de mallas Delaunay. Este trabajo estudia y reformula las etapas de Construcción (ImeshCm) y Mejoramiento (ImeshMm) del método Imesh, y utiliza este análisis para proponer un nuevo método de construcción de mallas, denominado kMesh. Esta nueva idea utiliza una combinación de mapas de distancia, esqueletización y distribución adaptativa de puntos con discos de Poisson. De esta manera, nuestro trabajo propone un algoritmo paralelo, para producir mallas adaptativas a partir de imágenes, en 2 y 3 dimensiones, considerando criterios de calidad en los elementos generados.Item Mejora de las fronteras en mallas simpliciales de múltiples materiales generadas a partir de imágenes(Universidad Católica San Pablo, 2018) Choque Ramos, Tony Liedyn; Cuadros Vargas, AlexUna imagen digital puede contener objetos compuestos de múltiples regiones que corresponden a diferentes propiedades del material, atributos físicos o químicos. Luego, al generar mallas simpliciales (en 2 y 3 dimensiones) de múltiples materiales a partir de imágenes, estas pueden contener singularidades en las fronteras entre las regiones particionadas. La mayoría de métodos actuales, que eliminan singularidades, consideran mallas que representan un solo objeto o material. Este trabajo se enfoca en la reparación de singularidades en mallas que contienen múltiples objetos o materiales. Para esto, utilizamos abordajes basados en la modificación del particionamiento (reetiquetado) e inserción de puntos. Estas ideas pueden ser combinadas para optimizar diferentes factores tales como: incrementar la velocidad, mantener en lo posible la forma de la partición original y conservar el número de elementos en la malla. Nuestra propuesta ha sido aplicada en mallas con diferentes números de singularidades y materiales, tanto de 2 como 3 dimensiones. En todos los casos se logró eliminar la totalidad de singularidades en el modelo. Adicionalmente, luego de que el modelo esté libre de singularidades, este trabajo presenta también algunas alternativas para suavizar fronteras basadas en reetiquetado de células y reubicación de vértices.Item Reconocimiento de acciones cotidianas(Universidad Católica San Pablo, 2016) Vizconde La Motta, Kelly; Cámara Chávez, GuillermoEl método propuesto consta de tres partes: la extracción de características, el uso de bolsa de palabras y la clasificación. Para la primera etapa se usó los descriptores STIP para el canal de intensidad, HOG para el canal de profundidad , MFCC y Espectrograma para el canal de audio. En la siguiente etapa se utilizó bolsa de palabras en cada tipo de información por separado. Para la generación del diccionario se usó K-means y para el proceso de clasificación se utilizó SVM. En la parte de experimentos los videos fueron divididos en clips, llegando a tener una tasa de asertividad del 94.4 % en la base de vıdeos Kitchen-UCSP, que fue elaborada para esta investigación y una tasa de asertividad del 88 % en la base de videos HMA.Item Reconocimiento de rostros con Elastic Bunch Graph Matching en aplicaciones de video(Universidad Católica San Pablo, 2017) Galdos Chávez, José Rodrigo; Gutiérrez Cáceres, Juan CarlosEl reconocimiento de rostros es un área con una gran cantidad de aplicaciones y técnicas. Muchas de esas técnicas ofrecen buenos resultados cuando se aplican a situaciones donde el ambiente en el cual se desea realizar el reconocimiento es controlado, esto se entiende como el control de los factores que influyen en el proceso de reconocimiento, tales como iluminación, pose del rostro, expresión facial, etc. Pero para el caso de ambientes no controlados, como lo es la videovigilancia, el reconocimiento de rostros aún presenta dificultades: variación en la iluminación, falta de colaboración de las personas a reconocer, entre varios otros. Debido a la importancia que tiene en seguridad y a la cantidad de infraestructura existente, es necesario aplicar el reconocimiento de rostros a video vigilancia. Para afrontar los problemas mencionados, proponemos un pipeline de reconocimiento de rostros usando EBGM con CLNF como reemplazo a la función de detección de puntos del algoritmo original, para finalmente ser aplicado en vídeo. Además en este trabajo de tesis se realizó un análisis paramétrico de EBGM para encontrar el factor más influyente en su rendimiento, junto con su comparación con otros métodos de reconocimiento de rostros. También se determinó que elementos forman parte del pipeline presentado como resultado final. Finalmente la probamos la propuesta en una base de datos creada a partir de tomas de una cámara de seguridad, que consta de 24 sujetos con 8 imágenes cada uno. Los resultados finales muestran una mejora en imágenes tomadas en la mañana y en el medio día respectivamente.Item Reidentificación de personas basada en aprendizaje de características de partes del cuerpo mediante redes convolucionales en triplet loss(Universidad Católica San Pablo, 2018) Durand Espinoza, Jonathan Antony; Camara Chavez, GuillermoReidentificación de personas consiste en reconocer si imágenes de dos personas obtenidas a través de un sistema de múltiples cámaras que no se superponen correspondan a la misma persona. A pesar de recientes avances en este campo, este problema aún permanece como un reto debido a que las imágenes en cámaras de viodevigilancia suelen ser de baja calidad, presentan cambios en la iluminación, así como variaciones en las poses de las personas. Métodos basados en aprendizaje profundo han alcanzado un notable avance en este tema, estos tienen como objetivo aprender las características que permitan discriminar de qué persona se trata dada una imagen. En esta tesis, proponemos un modelo diseñado desde cero que se apoya en la idea de función de perdida de tripletes (triplet loss) en redes neuronales convolucionales basados en partes del cuerpo en la reidentificación de personas, llamamos a nuestra arquitectura AETCNN. Nuestro modelo es capaz de aprender las características de las partes del cuerpo en imágenes de cámaras de vigilancia e integrar esas informaciones para producir las características finales. La eficacia de nuestro método se muestra al evaluar en diferentes bases de datos publica, siguiendo el mismo protocolo utilizado en el estado del arte comparando métricas como tiempo de entrenamiento de la red y capacidad de predicción. Experimentos muestran que nuestro enfoque alcanza resultados prometedores, obteniendo a una tasa de aciertos en ranking-1 de 81,20% ,65,50% y 34,40% en bases de datos como CUHK01, CUHK03 y PRID2011 respectivamente, contribuyendo así en el estado del arte.Item Surveillance video summarization based on trajectory rarity measure(Universidad Católica San Pablo, 2019) Quispe Torres, Gerar Francis; Mora Colque, Rensso Victor HugoThe dynamic video summarization of surveillance videos has several critical applications, mainly due to the wide availability of digital cameras in environments such as airports, train and bus stations, shopping centers, stadiums, buildings, schools, hospitals, roads, among others. This study presents an approach for the generation of dynamic summary on surveillance video domain based on human trajectories. It has an emphasis on trajectory descriptors in conjunction with the unsupervised clustering method. Our approach contribute to existing literature concerning the combination of methods and objectives. We hypothesize that the clustering of trajectories permits to identify rare trajectories base on their morphology. The clustering as an output provides numerous subsets of trajectories or clusters and the number of elements of a specific cluster is used to determine their rarity. Those subsets with few components are rare while the others that have a high number of elements are considered ordinary; therefore, the implications of our study show that is possible to use unsupervised clustering for automatic detection of rare trajectories based on their morphology and with this information segment videos. We experimented with different sets of trajectories segmenting the rare videos from our ground truth.