Visualización de resultados de búsquedas textuales usando proyecciones multidimensionales

dc.contributor.advisorCuadros Vargas, Alex
dc.contributor.advisorNonato, Luis Gustavo
dc.contributor.authorGómez Nieto, Erick Mauricio
dc.date.accessioned2017-06-07T14:56:11Z
dc.date.available2017-06-07T14:56:11Z
dc.date.issued2013
dc.description.abstractLos usuarios de Internet están muy familiarizados a que los resultados de una consulta sean exhibidos en una lista ordenada de snippets. Cada snippet posee contenido textual que muestra un resumen del documento referido (o página web) y un enlace hacia el mismo. Esta representación tiene muchas ventajas como por ejemplo proporcionar una navegación fácil y simple de interpretar. Sin embargo, cualquier usuario que usa motores de búsqueda podría reportar posiblemente alguna experiencia de decepción con este modelo. Aún tiene limitaciones en situaciones particulares, como el no proporcionar una visión general de la colección de documentos recuperados. Además, dependiendo de la naturaleza de la consulta por ejemplo, puede ser muy general, o ambigua, o mal expresada, la información deseada puede ser mal clasificada, o los resultados puede contemplar temas variados. Varias tareas de búsqueda serían mas fáciles si fuese devuelta a los usuarios una visión general de los documentos organizados con el fin de reflejar la forma como son relacionados, basados en el contenido. Proponemos una técnica de visualización para exhibir los resultados de consultas web que busca superar tales limitaciones. Esta combina la capacidad de preservación de vecindad de las proyecciones multidimensionales con la conocida representación basada en snippets. Esta visualización emplea una proyección multidimensional para derivar layouts bidimensionales de los resultados de la búsqueda, que preservan las relaciones de similaridad de texto, o vecindad. La similaridad es calculada mediante la aplicación de la similaridad de coseno sobre una representación “bag-of-words” vectorial de colecciones construidas a partir de los snippets. Si los snippets son exhibidos directamente de acuerdo con el layout derivado, ellos se sobreponen considerablemente, produciendo una visualización pobre. Nosotros superamos este problema definiendo un funcional de energía que considera tanto la sobreposición entre los snippets y la preservación de la estructura de las vecindades como fue dada en el layout de la proyección. Minimizando esta funcional de energía es proporcionada una representación bidimensional con preservación de las vecindades de los snippets textuales con sobre posición mínima. La visualización transmite tanto una visión global de los resultados de la consulta como los agrupamientos visuales que reflejan documentos relacionados, como es ilustrado en varios de los ejemplos presentados.es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.identifier.other1053086
dc.identifier.urihttps://hdl.handle.net/20.500.12590/15341
dc.language.isospaes_PE
dc.publisherUniversidad Católica San Pabloes_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/restrictedAccesses_PE
dc.sourceUniversidad Católica San Pabloes_PE
dc.sourceRepositorio institucional - UCSPes_PE
dc.subjectVisualización de la informaciónes_PE
dc.subjectmineración de datoses_PE
dc.subjectproyección multidimensionales_PE
dc.subjectvisualización de búsquedas en la Webes_PE
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.02.01es_PE
dc.titleVisualización de resultados de búsquedas textuales usando proyecciones multidimensionaleses_PE
dc.typeinfo:eu-repo/semantics/bachelorThesis
renati.advisor.dni29716900
renati.author.dni43351822
thesis.degree.disciplineCiencia de la Computaciónes_PE
thesis.degree.grantorUniversidad Católica San Pablo. Facultad de Ingeniería y Computaciónes_PE
thesis.degree.levelTítulo Profesionales_PE
thesis.degree.nameIngeniero Informáticoes_PE
thesis.degree.programEscuela Profesional de Ciencia de la Computaciónes_PE
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
GOMEZ_NIETO_ERI_PRO.pdf
Size:
359.54 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: