Postgrado - Ciencias de la Computación
Permanent URI for this community
Browse
Browsing Postgrado - Ciencias de la Computación by browse.metadata.advisor "Gomez Nieto, Erick"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
Item Exploración visual basada en similitud de grandes conjuntos de datos multidimensionales georreferenciados(Universidad Católica San Pablo, 2019) Peralta Aranibar, Eddie Rogger; Gomez Nieto, ErickLa visualización de grandes cantidades de datos es una de las principales tareas que realiza un analista de datos. En sistemas tradicionales de manejo de datos, registros de enormes conjuntos de datos no pueden ser consultados por su similitud debido a su complejidad, en términos de volumen y multiplicidad. En esta tesis, proponemos un enfoque efectivo para la indexación de millones de elementos, con el propósito de ejecutar simples y múltiples consultas visuales de similitud sobre datos multidimensionales asociadas a una ubicación geográfica. Nuestro enfoque hace uso del método Z-order curve para mapear nuestro conjunto de datos en una alta dimensionalidad a un espacio de una dimensión considerando la similitud entre los datos. Respaldamos nuestra propuesta mediante la comparación con otros métodos del estado del arte en la literatura, utilizando métricas de preservación de vecindad y analizando las ventajas y desventajas entre estos métodos. Adicionalmente, presentamos un conjunto de resultados usando datos reales de diversas fuentes y analizamos los conocimientos obtenidos a partir de su exploración interactiva.Item Un método radial interactivo para la exploración visual de datos en alta dimensión(Universidad Católica San Pablo, 2017) García Zanabria, Germain; Gomez Nieto, ErickEl tratamiento y descubrimiento de patrones en conjuntos de datos despierta gran interés en la comunidad de investigadores. Específicamente, en el manejo de datos multidimensionales se han realizado grandes avances. Sin embargo, todavía existen ciertas limitaciones como el costo computacional y la interacción con el usuario que impiden que la tarea de extracción de información sea simple y eficiente a la vez. Una técnica que mitiga estos dos problemas es Star Coordinates, método de visualización capaz de revelar patrones y grupos de datos multidimensionales mientras muestra el impacto de los atributos en la formación de la representación de los datos. A pesar de su utilidad, Star Coordinates tiene ciertos inconvenientes que impiden su uso en varios escenarios. Por ejemplo, cuando el número de dimensiones de los datos es realmente alto, las visualizaciones resultantes se vuelven desordenadas, lo que dificulta el análisis de la importancia de los atributos en la formación de grupos y/o patrones. En esta tesis proponemos iStar. Un nuevo método basado en Star Coordinates, para el análisis de datos en alta dimensión. El método propuesto se cimienta en el agrupamiento (basado en PCA, Centroides y Varianza) y reordenamiento de atributos (basado en Métricas y Similaridad) con el fin de mitigar la distorsión visual. El agrupamiento y reordenamiento se puede realizar de forma automática, así como de forma interactiva, lo que permite que el usuario pueda analizar aún más el impacto de los atributos en la visualización radial. La eficacia de nuestro enfoque se muestra a través de una serie de experimentos y estudios de casos, los cuales muestran evidencia de la utilidad del método propuesto.