Subvenciones I+D

Modelado, Descubrimiento, Exploración y Análisis da Data Lakes Medioambientales (UDC)

Referencia:
PID2022-141027NB-C21
Número de subproyectos:
2
Institución financiadora:
Ministerio de Ciencia e Innovación. Convocatoria 2022 Generación de Conocimiento
Presupuesto:
103.875 Euros
Duración:
01-sep-2023 al 31-ago-2026
Descripción:
El proyecto EarthDL-UDC pretende optimizar la gestión de la información almacenada en data lakes geoespaciales mediante la integración de estructuras de datos compactas, métodos de desarrollo basados en modelos y estrategias de gestión de la variabilidad. Este enfoque pretende crear sistemas de información más eficientes, fáciles de usar y rentables. El subproyecto se centrará específicamente en la definición de técnicas de ingeniería de software basadas en el desarrollo dirigido por modelos y la gestión de la variabilidad de familias de productos para minimizar el trabajo de implementación y agilizar el proceso de creación de sistemas de información. Además, el subproyecto tratará de definir estructuras de datos compactas que permitan un almacenamiento eficaz de la información geoespacial y mejoren el rendimiento de las técnicas de análisis de la información.
El desarrollo basado en modelos (MDD) y la gestión de la variabilidad son técnicas para reducir el esfuerzo en la construcción de sistemas de información. MDD utiliza modelos para crear visualizaciones que pueden  reutilizarse y modificarse fácilmente. La gestión de la variabilidad gestiona las variaciones en la funcionalidad de las aplicaciones identificando puntos en común/diferencias y creando abstracciones reutilizables. El uso de estas técnicas puede dar lugar a visualizaciones más eficientes, flexibles y mantenibles. El primer objetivo del proyecto es utilizar MDD y técnicas de gestión de la variabilidad para crear aplicaciones de visualización para data lakes geoespaciales. Mediante el uso de MDD, el proyecto pretende crear un conjunto de modelos que se puedan utilizar para generar el código necesario para las aplicaciones de visualización, lo que puede ayudar a garantizar la coherencia y reducir los errores en el proceso de desarrollo. Mediante el uso de técnicas de gestión de la variabilidad, el proyecto pretende crear aplicaciones de visualización que puedan manejar diferentes variaciones de la visualización, incluyendo diferentes tipos de gráficos como mapas de calor, histogramas, gráficos de líneas, etc. Esto permitirá a los usuarios comprender y explorar mejor los datos geoespaciales almacenados en el data lake al proporcionarles diversas formas de visualizar los datos e identificar patrones y tendencias.
Las estructuras de datos compactas están diseñadas para minimizar la cantidad de memoria necesaria para almacenar datos, al tiempo que permiten un acceso y una manipulación eficientes de esos datos. Aunque se han definido muchas estructuras de datos compactas, no se han utilizado ampliamente para el análisis en data lakes geoespaciales. Esto puede deberse a la falta de comprensión de las ventajas y limitaciones específicas de estas estructuras de datos, así como a los retos que implica su integración en las arquitecturas de data lakes existentes. Además, el análisis de datos geoespaciales requiere consultas y operaciones espaciales complejas, que pueden no ser adecuadas para determinadas estructuras de datos compactas. El segundo objetivo del proyecto es investigar y evaluar el uso de distintos tipos de estructuras de datos compactas para el almacenamiento y análisis eficientes de datos geoespaciales en un data lake. Tenemos previsto comparar el rendimiento de estas estructuras de datos compactas con las estructuras de datos tradicionales para determinar su eficacia e integrar las estructuras de datos compactas en el data lake para su análisis y visualización.