Subvencións I+D

Modelado, Descubrimento, Exploración e Análise da Data Lakes Medioambientais (UDC)

Referencia:
PID2022-141027NB-C21
Número de subproxectos:
2
Institución financiadora:
Ministerio de Ciencia e Innovación. Convocatoria 2022 Generación de Conocimiento
Orzamento:
103.875 Euros
Duración:
1-set-2023 ao 31-ago-2026
Descrición:
O proxecto EarthDL-UDC pretende optimizar a xestión da información almacenada en data lakes xeoespaciais mediante a integración de estruturas de datos compactas, métodos de desenvolvemento baseados en modelos e estratexias de xestión da variabilidade. Este enfoque pretende crear sistemas de información máis eficientes, doados de usar e rentables. O subproxecto centraráse nomeadamente na definición de técnicas de enxeñaría de software baseadas no desenvolvemento dirixido por modelos e a xestión da variabilidade de familias de produtos para minimizar o traballo de implementación e axilizar o proceso de creación de sistemas de información. Además, o subproxecto tratará de definir estruturas de datos compactas que permitan un almacenamento eficaz da información xeoespacial e melloren o rendemento das técnicas de análise da información.
O desenvolvemento baseado en modelos (MDD) e a xestión da variabilidade son técnicas para reducir o esforzo na construcción de sistemas de información. MDD utiliza modelos para crear visualizacións que poden reutilizarse e modificarse doadamente. A xestión da variabilidade xestiona as variacións na funcionalidade das aplicacións identificando puntos en común/diferenzas e creando abstraccións reutilizables. O uso destas técnicas pode dar lugar a visualizacións máis eficientes, flexibles e mantibles. O primeiro obxectivo do proxecto é utilizar MDD e técnicas de xestión da variabilidade para crear aplicacións de visualización para data lakes xeoespaciais. Mediante o uso de MDD, o proxecto pretende crear un conxunto de modelos que se podan utilizar para xerar o código necesario para as aplicacións de visualización, o que pode axudar a garantir a coherencia e reducir os erros no proceso de desenvolvemento. Mediante o uso de técnicas de xestión da variabilidade, o proxecto pretende crear aplicacións de visualización que podan manexar diferentes variacións da visualización, incluindo diferentes tipos de gráficos como mapas de calor, histogramas, gráficos de liñas etc. Esto permitirá aos usuarios comprender e explorar mellor os datos xeoespaciais almacenados no data lake ao proporcionarlles diversas formas de visualizar os datos e identificar patróns e tendencias.
As estruturas de datos compactas están deseñadas para minimizar a cantidade de memoria necesaria para almacenar datos, ao tempo que permiten un acceso e unha manipulación eficientes deses datos. Ainda que se teñen definido moitas estruturas de datos compactas, non se empregaron ampliamente para a análise en data lakes xeoespaciais. Esto pode deberse á falta de comprensión das vantaxas e limitacións específicas destas estruturas de datos, así como aos retos que implica a súa integración nas arquitecturas de data lakes existentes. Ademais, a análise de datos xeoespaciais require consultas e operacións espaciais complexas, que poden non ser adecuadas para determinadas estruturas de datos compactas. O segundo obxectivo do proxecto é investigar e avaliar o uso de distintos tipos de estruturas de datos compactas para o almacenamento e análise eficientes de datos xeoespaciais nun data lake. Temos previsto comparar o rendemento destas estruturas de datos compactas coas estruturas de datos tradicionais para determinar a súa eficacia e integrar as estruturas de datos compactas no data lake para o seu análise e visualización.