Pregrado - Ciencias de la Computación
Permanent URI for this community
Browse
Browsing Pregrado - Ciencias de la Computación by browse.metadata.advisor "Meza Lovon, Graciela Lecireth"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
Item Análisis layout de documentos históricos basado en operadores morfológicos y componentes conectados(Universidad Católica San Pablo, 2020) Alarcon Arenas, Sebastian Wilde; Meza Lovon, Graciela LecirethDurante las últimas décadas, el interés en preservar documentos históricos digitales ha ganado considerable atención. Para aprovechar todas las ventajas y oportunidades que ofrecen los documentos digitalizados, es necesario comprender su contenido. El primer paso hacia esa comprensión es determinar los elementos de dicho documento, como figuras, títulos y subtítulos, texto, etc. Esta tesis presenta un nuevo enfoque híbrido para analizar la estructura de los documentos que se basa en operadores morfológicos y componentes conectados. El método propuesto se divide en dos etapas, preprocesamiento, en las que se mejora la calidad de las imágenes del documento; y análisis de layout, en el que identificamos tres tipos de layouts: títulos, párrafos gráficos. Este proceso también incluye un proceso de fragmentación, en el que dividimos la imagen de la página en secciones de manera que mejora la identificación de elementos del documento histórico. Finalmente, se realiza los experimentos en un conjunto de datos que contiene periódicos históricos antiguos, comparándolo con las técnicas base utilizadas para la implementación de esta propuesta.Item Entrenando una red neuronal Mask R-CNN con imágenes sintéticas para la detección y segmentación de objetos en imágenes reales de maquinaria(Universidad Católica San Pablo, 2021) Cerpa Salas, Alonso Jesus; Meza Lovon, Graciela LecirethEn los últimos años, las redes neuronales convolucionales se han utilizado ampliamente para resolver problemas como la clasificación de imágenes, la detección de objetos y la segmentación de objetos. Sin embargo, estas redes neuronales requieren de una gran cantidad de datos correctamente etiquetados para funcionar adecuadamente. Por este motivo, los procesos de etiquetado de datos se llevan a cabo reclutando personas que etiquetarán los datos manualmente. Esto es un problema, ya que consume mucho tiempo y dinero, por lo que algunos investigadores han estudiado el uso de sistemas que generan datos sintéticos y a la vez, los etiquetan. Dada esta problemática, en el presente trabajo se plantea un sistema para generar datos sintéticos mediante un renderizador, que utiliza fondos aleatorios (imágenes) y 3 modelos 3D de piezas de maquinaria. Luego, dichos datos sintéticos son etiquetados por nuestro sistema, para las tareas de detección y segmentación de objetos. Adicionalmente, aplicamos un filtro de Gaussian Blur a nuestras imágenes sintéticas para que den mejores resultados en el entrenamiento posterior. Después, nuestro sistema entrena una red neuronal Mask R-CNN (pre-entrenada con el conjunto de datos COCO) con los datos sintéticos con Gaussian Blur generados y etiquetados anteriormente. Finalmente, nuestro sistema realiza pruebas de la red neuronal con datos reales (fotografías de las 3 piezas de maquinaria en el mundo real), donde se consiguen resultados óptimos.