Se ha desarrollado una técnica de predicción de temperaturas extremas en diversos puntos de interés dentro del ámbito regional. Se ha empleado el modelo de regresión lineal múltiple para la obtención de las mejores ecuaciones de regresión, donde el predictando es la temperatura extrema del lugar que se quiere pronosticar, y los predictores son las temperaturas extremas de los lugares cercanos que se pronostican usualmente. Una vez obtenidas las mejores ecuaciones predictoras, se programan, automatizándose el proceso.
1. Introducción.
En los GPV's se pronostican habitualmente las temperaturas extremas de las ciudades que pronostica el MOS (Model Output Statistics). En Cantabria así sucede para Santander. Sin embargo hay otras ciudades importantes desde el punto de vista demográfico (Torrrelavega) o climático (Potes y Reinosa) cuya temperatura extrema interesa pronosticar. Esto es extensible a otras regiones. El método de regresión lineal múltiple que hemos utilizado aprovecha el pronóstico previo realizado tanto por el MOS como por los GPV's.
2. Modelo de regresión lineal múltiple. Selección de los predictores.
Se trata de encontrar una expresión matemática que represente la relación existente entre el predictando y el conjunto de los predictores. A esta ecuación matemática se le denomina ecuación de regresión.
Para obtener la ecuación de regresión se necesita una serie homogénea y lo más larga posible de observaciones de los predictores y el predictando correspondiente.
Si se utiliza el modelo de regresión lineal múltiple la ecuación de regresión vendrá dada por:
donde X1,....,Xn son los predictores e Y el valor estimado por el modelo.
El cálculo de los coeficientes c0, c1,...., cn consiste en imponer la condición de que sea mínima la expresión
donde yi son las observaciones del predictando.
El proceso de selección de los predictores más convenientes es fundamental para calcular la mejor ecuación de predicción.
En una primera etapa se han seleccionado como predictores las temperaturas extremas de poblaciones cercanas que rodean a la población cuya temperatura se quiere pronosticar.
En una segunda fase se calcula el coeficiente de correlación lineal de Pearson de cada predictor con el predictando. Sólo se retienen aquellos predictores que tienen un nivel de significación unilateral menor que 0.001, que como es menor que 0.05 permite rechazar la hipótesis nula de independencia lineal
entre las dos variables.
A continuación se calcula la ecuación de regresión para todos los predictores retenidos, eliminándose aquellos predictores cuya presencia en la ecuación no mejora el coeficiente de correlación múltiple.
3. Análisis de los resultados.
En la Figura 1 se muestran las poblaciones objeto del estudio, así como los predictores seleccionados.
Se ha dividido el año en cuatro períodos: diciembre - febrero, marzo - mayo,
junio - agosto y septiembre - noviembre.
En la Tabla 1 se muestran los resultados para Arganza, cuya temperatura extrema se asimila a la de Cangas de Narcea. R es el coeficiente de correlación lineal múltiple de Pearson, R2 es el coeficiente de determinación, R2aj es el coeficiente de determinación ajustado, Est es el error standard y
sig F es el grado de significación de la prueba de hipótesis al aplicar el análisis de la varianza a la regresión.
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||
|
El grado de significación se puede interpretar como la probabilidad de que la relación encontrada se deba al azar. Para todas las ecuaciones de regresión calculadas el grado de significación es menor que 0.0001, por lo que se rechaza la hipótesis nula y se concluye que el predictando y los predictores están relacionados y tiene sentido plantearse la predicción del uno a partir de los otros.
En la Tabla 2 se muestran los resultados de una evaluación realizada para la temperatura máxima aprovechando los resultados de la campaña de incendios del año 1994. EM es el error medio, EAM es el error absoluto medio y DS es la desviación standard.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4. Conclusiones.
Para todas las ecuaciones de regresión calculadas el grado de significación es menor que 0.0001, lo que significa que tiene sentido plantearse la predicción del predictando a partir de los predictores.
Aunque la evaluación se ha realizado sobre una pequeña muestra y sólo para la temperatura máxima, los resultados son satisfactorios ya que los errores de los predictandos son similares y en algunos casos inferiores a los de los predictores.
Una de las ventajas de este método es su sencillez, ya que las ecuaciones de regresión se programan fácilmente automatizándose el proceso y facilitando la operatividad.
Referencias.
Arasti E, Arteche J. 1996. Pronóstico de temperaturas extremas en el ámbito regional. Nota Técnica N. 5. S.E.D. CMT de Cantabria y Asturias. Instituto Nacional de Meteorología.
Ayuso J.J. 1994. Predicción estadística operativa en el INM. Publicación B-34 del Instituto Nacional de Meteorología.