Departamento de Ciencias de la Computación
Permanent URI for this community
Browse
Browsing Departamento de Ciencias de la Computación by browse.metadata.advisor "Cayllahua Cahuina, Edward Jorge Yuri"
Now showing 1 - 3 of 3
Results Per Page
Sort Options
Item Flash image enhancement via ratio-log image translation to ambient images(Universidad Católica San Pablo, 2021) Chavez Alvarez, Jose Armando; Cayllahua Cahuina, Edward Jorge YuriTo illuminate low-light scenarios in photography, photographers usually use the camera flash, this produces flash images. Nevertheless, this external light may produce non-uniform illumination and unnatural color of objects, especially in low-light conditions. On the other hand, in an ambient image, an image captured with the available light in the ambient, the illumination is evenly distributed. We therefore consider ambient images as the enhanced version of flash images. Thus, with a fully convolutional network, and a flash image as input, we first estimate the ratio-log image. Then, our model produces the ambient image by using the estimated ratio-log image and ash image. Hence, high-quality information is recovered with the flash image. Our model generates suitable natural and uniform illumination on the FAID dataset with SSIM = 0:662, and PSNR = 15:77, and achieves better performance than state-of-the-art methods. We also analyze the components of our model and how they affect the overall performance. Finally, we introduce a metric to measure the similarity of naturalness of illumination between target and predicted images.Item Framework de algoritmos basados en reconocimiento de rostros para la toma de asistencia automática de alumnos en una institución educativa usando dispositivos móviles(Universidad Católica San Pablo, 2024) Laures Garcia, Guillermo Reynaldo; Cayllahua Cahuina, Edward Jorge YuriEn la actualidad, las instituciones educativas, tanto en colegios como en universidades, hacen uso de plataformas académicas para gestionar la asistencia de los alumnos en el aula. Por lo general, el proceso implica que el profesor llame a cada alumno por su nombre y apellido, lo cual puede consumir considerable tiempo, especialmente en clases con un gran número de estudiantes. Esta tesis tiene como objetivo desarrollar una herramienta computacional que agilice y optimice el proceso de toma de asistencia en entornos académicos. La solución propuesta consiste en la creación de un framework que contiene una aplicación móvil de registro automático de asistencia en tiempo real, ofreciendo una alternativa eficiente al método convencional que emplean los profesores en la actualidad. La innovación clave de esta herramienta radica en la implementación de técnicas biométricas de reconocimiento facial. Estas técnicas, reconocidas por su modernidad y robustez, han demostrado resultados satisfactorios en diversas aplicaciones. La adopción de esta nueva forma de tomar la asistencia promete reducir significativamente el tiempo dedicado a esta tarea, mejorando la eficiencia del proceso. En esta tesis, el framework propuesto logra una tasa de acierto del 80 % en el reconocimiento en un entorno no controlado durante la toma de asistencia.Item Un modelo ligero para la rápida detección y clasificación de objetos en movimiento orientado a sistemas inteligentes de vigilancia(Universidad Católica San Pablo, 2024) Palma Ugarte, Joaquin Rodrigo; Cayllahua Cahuina, Edward Jorge YuriLa detección y clasificación de objetos en movimiento son tareas fundamentales en la vigilancia inteligente. Sin embargo, las soluciones actuales suelen emplear dos procesos aislados para detectar y clasificar objetos en movimiento. Primero, se detectan todos los objetos dentro de la escena y luego se emplea un algoritmo separado para determinar el subconjunto de objetos que están en movimiento. Además, diversas soluciones emplean redes complejas que requieren muchos recursos computacionales, a diferencia de las soluciones livianas que podrían llevar a un uso generalizado. En esta Tesis proponemos TRG-Net, un modelo unificado que se puede ejecutar en dispositivos computacionalmente limitados para detectar y clasificar únicamente objetos en movimiento. Esta propuesta se basa en la arquitectura Faster R-CNN, MobileNetV3 como extractor de características y un método basado en GMM para una búsqueda rápida y flexible de regiones de interés. TRG-Net reduce el tiempo de inferencia al unificar las tareas de detección de objetos en movimiento y clasificación de imágenes, limitando las propuestas de regiones a un número fijo configurable de posibles objetos en movimiento. Los experimentos con vídeos de vigilancia heterogéneos y el conjunto de datos de Kitti para la detección de objetos 2D muestran que nuestro enfoque mejora el tiempo de inferencia de Faster RCNN de 0.176 a 0.149 s, utilizando menos parámetros de 18.91 M a 18.30 M, mientras mantiene la precisión promedio media mAP de 0.423. Por lo tanto, TRG-Net logra compensaciones más tangibles entre precisión y velocidad, y podría aplicarse para abordar problemas del mundo real.