Acelerando el tiempo de busqueda en consultas de tipo Timebox en series de tiempo usando el Segment Buddy Tree con Range Maximun-Minimum Query
Loading...
Date
2024
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Católica San Pablo
Abstract
Las series de tiempo son esenciales en una variedad de campos, incluidas las finanzas, la meteorología, la salud y la informática urbana, entre otros. Estos datos se generan y almacenan a un ritmo cada vez mayor. Los analistas generalmente necesitan explorar, comparar y relacionar los datos de múltiples series de tiempo cuyos números pueden oscilar desde las decenas hasta los millares; por ejemplo, múltiples acciones de la bolsa de valores, consumo de energía de las máquinas, etc. llegando a ser millones de datos a explorar. Actualmente, existe una gran demanda para la exploración de datos de series de tiempo a gran escala. Sin embargo, las consultas usadas han demostrado tener un tiempo linealmente proporcional al tamaño de las series de tiempo, lo que las hace poco prácticas. Una de estas consultas difíciles es la consulta de tipo Timebox. En esta investigación, proponemos acelerar la consulta de tipo Timebox haciendo uso de la estructura de datos Buddy Tree y filtrando los resultados con consultas de Range Minimum/Maximum Query (RMQ). Este tipo de búsqueda ha sido recientemente abordado; a diferencia de los resultados obtenidos por el KD-Box, nuestros resultados son obtenidos a partir del conjunto total de datos y no con aproximaciones de las series de tiempo, esto elimina la posibilidad de obtener series que no pertenecen al Timebox y series de tiempo que perteneciendo no son encontradas por el método de búsqueda. Para comprobar nuestras hipótesis realizamos un conjunto de experimentos que evidencian la eficiencia de nuestra propuesta