Riccardo Silini defiende su tesis sobre inferencia causal y métodos de previsión para el análisis de datos climáticos
06/07/2022
Riccardo Silini defendió su tesis codirigida por Cristina Masoller y Marcelo Barreiro el 5 de julio en el Campus Terrassa. Titulada "Causal inference and forecasting methods for clima data analysis ", la tesis presenta técnicas de análisis de datos para identificar aquellos procesos que contengan información causal para la predicción de un proceso de interés, y algoritmos de aprendizaje automático para mejorar la predicción del fenómeno climático denominado oscilación de Madden-Julian.
Para avanzar en el pronóstico de series temporales, es necesario avanzar en múltiples frentes. En esta tesis, se desarrollan algoritmos para descubrir relaciones causales que identifican los procesos que actúan como fuentes potenciales de información y pueden ayudar a mejorar la predicción del proceso de interés. En complementación a esto, los algoritmos de aprendizaje automático, permiten explotar dicha información para construir modelos de pronóstico basados en la observación de datos para, de esta forma, corregir los modelos dinámicos.
La identificación de indicadores fiables de relaciones de causalidad a partir de series temporales es esencial en muchas disciplinas. Los principales desafíos en este ámbito se encuentran en distinguir la correlación de la causalidad, así como diferenciar entre las interacciones directas e indirectas. A lo largo de los años, se han propuesto numerosos métodos de inferencia causal basados en la observación de datos. No obstante, su éxito depende enormemente de las características del sistema a investigar. A menudo, los requisitos de sus datos, el coste computacional o el número de parámetros limitan su aplicabilidad.
En esta tesis, se propone una medida computacionalmente eficiente para el testeo de causalidad, con el fin de solucionar las limitaciones de aplicabilidad de las medidas teóricas de la información, debido a su alto coste computacional. La métrica que se propone resulta ser muy valiosa cuando las redes neuronales de causalidad necesitan inferirse a partir de análisis de un gran número de series temporales relativamente cortas. También puede resultar muy útil en la selección de entradas en los algoritmos de machine learning. De hecho, permite identificar aquellos procesos que contengan información útil en la predicción de cierto proceso dado. Esta característica es particularmente útil para sistemas compuestos por un gran número de procesos, cuyas interacciones son escasamente conocidas.
El impacto socioeconómico de los fenómenos meteorológicos extremos llama la atención a los investigadores en el desarrollo de nuevas metodologías con el objetivo de obtener predicciones meteorológicas más precisas. La Oscilación de Madden-Julian (MJO) es el modo dominante de variabilidad en la atmósfera tropical en escalas temporales subestacionales, y puede promover o aumentar eventos extremos tanto en el trópico como el extratrópico. Actualmente, la prediccion de la MJO está lejos de alcanzarse, lo que deja un gran margen de mejora en los modelos de pronóstico. Para mejorar su habilidad de predicción, en esta tesis, se escogerán dos aproximaciones diferentes de aprendizaje automático. Primero, se usará el machine learning como una técnica independiente, mostrando que dos redes neuronales artificiales, una red neuronal feed forward y una red neuronal recurrente, permiten una predicción competitiva, pero sin superar la habilidad de los modelos dinámicos actuales. Posteriormente, se combinarán modelos dinámicos con machine learning, que permitirán mejorar las predicciones del mejor modelo dinámico. En particular, el aprendizaje automático permite mejorar la predicción de la intensidad de los eventos y, así como su localización geográfica.
Compartir: