Búsqueda por similitud semántica y estructural del contenido aplicada en documentos XML

dc.contributor.advisorTicona Herrera, Regina Paola
dc.contributor.authorDongo Escalante, Irvin Franco
dc.date.accessioned2017-06-13T20:14:53Z
dc.date.available2017-06-13T20:14:53Z
dc.date.issued2014
dc.description.abstractEn estos últimos años la gran cantidad de información que se encuentra sobre internet requiere una nueva manera de estructurarla, para facilitar su representación, manipulación y recuperación; es así como aparece Extensible Mark-up Language (XML) como un estándar para la representación de datos en la Web. Su flexibilidad y la gran demanda que tiene, han permitido que se desarrollen un conjunto de técnicas para la comparación, consulta, clasificación, entre otras. La adopción de dicho estándar permite un mejor manejo y estructura de la información, así como una gran variedad de aplicaciones en diversas áreas del conocimiento. Tal es así como el área de Derecho que se ha elegido como caso de prueba dentro de la presente Tesis. Dicha área está sufriendo una transformación en el manejo y administración de su información (leyes, decretos, contratos, etc.) hacia estándares que tienen como base al XML. Esta transformación toma cada día más fuerza, debido a la necesidad de manejar gran cantidad de documentos heterogéneos donde el análisis de los datos para su recuperación debe realizarse de forma muy especializada. Para ello es necesario un análisis no solo de la estructura del documento sino un estudio del contenido, no por coincidencia de palabras como se está´ haciendo actualmente, sino por el significado real que la palabra representa en el documento, trabajando la parte de sinonimia, polisemia y la relación entre los términos. La presente investigación desarrolla un algoritmo basado en Indexación Semántica Latente (LSI) para la recuperación de información, donde la relación entre palabras esta´ afectada por la ubicación de las mismas dentro del documento; esto quiere decir, que el valor se verá influenciado de acuerdo a la posición en la que se presente (título, descripción, comentarios, etc.). Con este análisis semántico se mejora los resultados de las consultas en cuanto a su precisión debido a que no se descuida la parte estructural de los documentos, lo que proporciona información adicional en cuanto al contexto de la búsqueda. Finalmente, el trabajo se enfoca en la recuperación de información en dos bases de datos Initiative for the Evaluation of XML retrieval (INEX) y Derecho Ambiental como área de aplicación, midiendo su eficiencia mediante un cluster para posteriormente utilizar un ejecutor de consultas.es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.identifier.other1035253
dc.identifier.urihttps://hdl.handle.net/20.500.12590/15372
dc.language.isospaes_PE
dc.publisherUniversidad Católica San Pabloes_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/restrictedAccesses_PE
dc.sourceUniversidad Católica San Pabloes_PE
dc.sourceRepositorio institucional - UCSPes_PE
dc.subjectBases de datoses_PE
dc.subjectRecuperación de la informaciónes_PE
dc.subjectSemánticaes_PE
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.02.01es_PE
dc.titleBúsqueda por similitud semántica y estructural del contenido aplicada en documentos XMLes_PE
dc.typeinfo:eu-repo/semantics/bachelorThesis
thesis.degree.disciplineCiencia de la Computaciónes_PE
thesis.degree.grantorUniversidad Católica San Pablo. Facultad de Ingeniería y Computaciónes_PE
thesis.degree.levelTítulo Profesionales_PE
thesis.degree.nameLicenciado en Ciencia de la Computaciónes_PE
thesis.degree.programEscuela Profesional de Ciencia de la Computaciónes_PE
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
DONGO_ESCALANTE_IRV_BUS.pdf
Size:
5.84 MB
Format:
Adobe Portable Document Format