Análisis layout de documentos históricos basado en operadores morfológicos y componentes conectados

dc.contributor.advisorMeza Lovon, Graciela Lecireth
dc.contributor.authorAlarcon Arenas, Sebastian Wilde
dc.date.accessioned2020-10-26T23:08:08Z
dc.date.available2020-10-26T23:08:08Z
dc.date.issued2020
dc.description.abstractDurante las últimas décadas, el interés en preservar documentos históricos digitales ha ganado considerable atención. Para aprovechar todas las ventajas y oportunidades que ofrecen los documentos digitalizados, es necesario comprender su contenido. El primer paso hacia esa comprensión es determinar los elementos de dicho documento, como figuras, títulos y subtítulos, texto, etc. Esta tesis presenta un nuevo enfoque híbrido para analizar la estructura de los documentos que se basa en operadores morfológicos y componentes conectados. El método propuesto se divide en dos etapas, preprocesamiento, en las que se mejora la calidad de las imágenes del documento; y análisis de layout, en el que identificamos tres tipos de layouts: títulos, párrafos gráficos. Este proceso también incluye un proceso de fragmentación, en el que dividimos la imagen de la página en secciones de manera que mejora la identificación de elementos del documento histórico. Finalmente, se realiza los experimentos en un conjunto de datos que contiene periódicos históricos antiguos, comparándolo con las técnicas base utilizadas para la implementación de esta propuesta.es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.identifier.other1072795
dc.identifier.urihttps://hdl.handle.net/20.500.12590/16403
dc.language.isospaes_PE
dc.publisherUniversidad Católica San Pabloes_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/restrictedAccesses_PE
dc.sourceUniversidad Católica San Pabloes_PE
dc.sourceRepositorio Institucional - UCSPes_PE
dc.subjectAnálisis layoutes_PE
dc.subjectComponentes conectadoses_PE
dc.subjectOperadores morfológicoses_PE
dc.subjectDocumentos históricoses_PE
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.02.01es_PE
dc.titleAnálisis layout de documentos históricos basado en operadores morfológicos y componentes conectadoses_PE
dc.typeinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_PE
renati.advisor.dni40222974
renati.advisor.orcidhttps://orcid.org/0000-0002-9773-7265es_PE
renati.author.dni70840316
renati.discipline611016es_PE
renati.jurorYessenia Deysi Yari Ramoses_PE
renati.jurorJuan Carlos Gutiérrez Cácereses_PE
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesional
renati.typehttps://purl.org/pe-repo/renati/type#tesis
thesis.degree.disciplineCiencia de la Computaciónes_PE
thesis.degree.grantorUniversidad Católica San Pablo. Departamento de Ciencia de la Computaciónes_PE
thesis.degree.levelTítulo Profesionales_PE
thesis.degree.nameLicenciado en Ciencia de la Computaciónes_PE
thesis.degree.programPrograma Profesional de Ciencia de la Computaciónes_PE
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
ALARCON_ARENAS_SEB_LAY.pdf
Size:
7.89 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: