Departamento de Ciencias de la Computación
Permanent URI for this community
Browse
Browsing Departamento de Ciencias de la Computación by browse.metadata.advisor "Cámara Chávez, Guillermo"
Now showing 1 - 3 of 3
Results Per Page
Sort Options
Item Detección de eventos anómalos en vídeo(Universidad Católica San Pablo, 2017) Menejes Palomino, Neptalí; Cámara Chávez, GuillermoEn los últimos años, la detección de eventos anómalos en secuencias de video ha atraído una mayor atención en la comunidad de investigación de visión por computador. Esto ha ocurrido debido a la creciente necesidad de utilizar los sistemas de vigilancia automatizados para mejorar la seguridad en los espacios públicos y privados. Si bien se han logrado avances, todavía existen algunas limitaciones en la investigación actual. Es decir, la mayoría de los métodos de la literatura se enfocan en la detección de eventos anómalos específicos, y algunos todavía no son capaces de detectar más de dos tipos de anomalías. En esta investigación, se propone un nuevo modelo para la detección y localización de eventos anómalos en áreas peatonales. El objetivo es diseñar un algoritmo que permita detectar eventos anómalos mediante el uso de la información de movimiento y la apariencia. La información de movimiento se representa a través del uso de la velocidad y la aceleración del flujo óptico, y la información de apariencia es representado mediante la textura y la gradiente del flujo óptico. Para representar estas características se introduce el uso de parches espacio-temporales sin superposición. A diferencia de los métodos de la literatura, el modelo propuesto proporciona una solución general para detectar eventos anómalos tanto globales como locales. Además, en la etapa de detección se presentan problemas de perspectiva, esto debido a que los objetos cercanos a la cámara parecen ser grandes, mientras que los objetos alejados a la cámara parecen ser pequeños.. Para abordar estos problemas, se propone la clasificación por región. Los resultados experimentales sobre dos bases de datos (UCSD y UMN) y la comparación con los métodos de la literatura validan el rendimiento y la robustez del modelo propuesto. Los resultados del método propuesto sobre la base de datos UCSD Peds2 logra un EER de 07.2% y un AUC de 0.977 y en la base de datos UMN se logra un 0.998 de AUC en la escena 1 y 0.995 de AUC en la escena 3, estos resultados superan a los resultados de la literatura. Mientras tanto, los resultados sobre las bases de datos UCSD Peds1 logra un EER de 29.2% y un AUC de 0.792 y en la base de datos UMN escena 2 se logra un 0.948 de AUC, estos resultados son comparables con los resultados de los métodos de la literatura, esto ocurre debido a que estas bases de datos presentan problemas de perspectiva.Item GCTW Alignment for isolated gesture recognition(Universidad Católica San Pablo, 2018) Guzmán Zenteno, Leonardo Braulio; Cámara Chávez, GuillermoIn recent years, there has been increasing interest in developing automatic Sign Language Recognition (SLR) systems because Sign Language (SL) is the main mode of communication between deaf people all over the world. However, most people outside the deaf community do not understand SL, generating a communication problem, between both communities. Recognizing signs is a challenging problem because manual signing (not taking into account facial gestures) has four components that have to be recognized, namely, handshape, movement, location and palm orientation. Even though the appearance and meaning of basic signs are well-defined in sign language dictionaries, in practice, many variations arise due to different factors like gender, age, education or regional, social and ethnic factors which can lead to significant variations making hard to develop a robust SL recognition system. This project attempts to introduce the alignment of videos into isolated SLR, given that this approach has not been studied deeply, even though it presents a great potential for correctly recognize isolated gestures. We also aim for a user-independent recognition, which means that the system should give have a good recognition accuracy for the signers that were not represented in the data set. The main features used for the alignment are the wrists coordinates that we extracted from the videos by using OpenPose. These features will be aligned by using Generalized Canonical Time Warping. The resultant videos will be classified by making use of a 3D CNN. Our experimental results show that the proposed method has obtained a 65.02% accuracy, which places us 5th in the 2017 Chalearn LAP isolated gesture recognition challenge, only 2.69% away from the first place.Item Reconocimiento de acciones cotidianas(Universidad Católica San Pablo, 2016) Vizconde La Motta, Kelly; Cámara Chávez, GuillermoEl método propuesto consta de tres partes: la extracción de características, el uso de bolsa de palabras y la clasificación. Para la primera etapa se usó los descriptores STIP para el canal de intensidad, HOG para el canal de profundidad , MFCC y Espectrograma para el canal de audio. En la siguiente etapa se utilizó bolsa de palabras en cada tipo de información por separado. Para la generación del diccionario se usó K-means y para el proceso de clasificación se utilizó SVM. En la parte de experimentos los videos fueron divididos en clips, llegando a tener una tasa de asertividad del 94.4 % en la base de vıdeos Kitchen-UCSP, que fue elaborada para esta investigación y una tasa de asertividad del 88 % en la base de videos HMA.