IV Simposio Nacional de Predicci≤n

Memorial "Alfonso Ascaso"

Madrid 15-19 Abril 1996

I.N.M.


PREDICCION DE TEMPERATURAS EXTREMAS EN EL AMBITO REGIONAL

Eduardo Arasti Barca
José Arteche García

S.E.D. CMT de Cantabria y Asturias (I.N.M.)

RESUMEN

Se ha desarrollado una técnica de predicción de temperaturas extremas en diversos puntos de interés dentro del ámbito regional. Se ha empleado el modelo de regresión lineal múltiple para la obtención de las mejores ecuaciones de regresión, donde el predictando es la temperatura extrema del lugar que se quiere pronosticar, y los predictores son las temperaturas extremas de los lugares cercanos que se pronostican usualmente. Una vez obtenidas las mejores ecuaciones predictoras, se programan, automatizándose el proceso.

1.    Introducción.

En los GPV's se pronostican habitualmente las temperaturas extremas de las ciudades que pronostica el MOS (Model Output Statistics). En Cantabria así sucede para Santander. Sin embargo hay otras ciudades importantes desde el punto de vista demográfico (Torrrelavega) o climático (Potes y Reinosa) cuya temperatura extrema interesa pronosticar. Esto es extensible a otras regiones. El método de regresión lineal múltiple que hemos utilizado aprovecha el pronóstico previo realizado tanto por el MOS como por los GPV's.

2.    Modelo de regresión lineal múltiple. Selección de los predictores.

Se trata de encontrar una expresión matemática que represente la relación existente entre el predictando y el conjunto de los predictores. A esta ecuación matemática se le denomina ecuación de regresión.

Para obtener la ecuación de regresión se necesita una serie homogénea y lo más larga posible de observaciones de los predictores y el predictando correspondiente.

Si se utiliza el modelo de regresión lineal múltiple la ecuación de regresión vendrá dada por:

Y = c0+c1X1+....+cnXn

donde X1,....,Xn son los predictores e Y el valor estimado por el modelo.

El cálculo de los coeficientes c0, c1,...., cn consiste en imponer la condición de que sea mínima la expresión


Rough Equation

SUM
(yi-Y)2

donde yi son las observaciones del predictando.

El proceso de selección de los predictores más convenientes es fundamental para calcular la mejor ecuación de predicción.

En una primera etapa se han seleccionado como predictores las temperaturas extremas de poblaciones cercanas que rodean a la población cuya temperatura se quiere pronosticar.

En una segunda fase se calcula el coeficiente de correlación lineal de Pearson de cada predictor con el predictando. Sólo se retienen aquellos predictores que tienen un nivel de significación unilateral menor que 0.001, que como es menor que 0.05 permite rechazar la hipótesis nula de independencia lineal

entre las dos variables.

A continuación se calcula la ecuación de regresión para todos los predictores retenidos, eliminándose aquellos predictores cuya presencia en la ecuación no mejora el coeficiente de correlación múltiple.


Figura 1: Ejemplo práctico del método.

3.    Análisis de los resultados.

En la Figura 1 se muestran las poblaciones objeto del estudio, así como los predictores seleccionados.

Se ha dividido el año en cuatro períodos: diciembre - febrero, marzo - mayo,

junio - agosto y septiembre - noviembre.

En la Tabla 1 se muestran los resultados para Arganza, cuya temperatura extrema se asimila a la de Cangas de Narcea. R es el coeficiente de correlación lineal múltiple de Pearson, R2 es el coeficiente de determinación, R2aj es el coeficiente de determinación ajustado, Est es el error standard y

sig F es el grado de significación de la prueba de hipótesis al aplicar el análisis de la varianza a la regresión.

R
R2
R2aj
Est
sig F

Dic-Feb

740 casos
.8762
.76772
.76712
1.86133
.0000
Arganza=.40315*Lugo+.61876*Oviedo-.44114

Mar-May

817 casos
.93977
.88318
.88275
1.7857
.0000
Arganza=.45777*Lugo+.11217*León+

.5288*Oviedo-1.2306

Jun-Ago

794 casos
.93694
.87786
.8774
1.61059
.0000
Arganza=.44953*Lugo+.09308*León+

+.60567*Oviedo-2.52005

Sep-Nov

698 casos
.94079
.88508
.88459
1.90832
.0000
Arganza=.34119*Lugo+.6035*Oviedo+

+.1371*León-.96604
Ecuación de regresión. Temperatura Máxima. Arganza
R
R2
R2aj
Est
sig F

Dic-Feb

740 casos
.77487
.60043
.5988
2.9404
.0000
Arganza=.68025*Lugo+.12384*León+

+.11712*Oviedo-.8771

Mar-May

817 casos
.77891
.6067
.60524
2.20534
.0000
Arganza=.38122*Lugo+.0913*León+

.3473*Oviedo+.09562

Jun-Ago

794 casos
.78968
.6236
.62268
1.99577
.0000
Arganza=.38629*Lugo+.61883*Oviedo-.81342

Sep-Nov

698 casos
.83502
.69727
.69643
2.63139
.0000
Arganza=.61974*Lugo+.37621*Oviedo-1.26021
Ecuación de regresión. Temperatura Mínima. Arganza

Tabla 1: Resultados de la regresión.

El grado de significación se puede interpretar como la probabilidad de que la relación encontrada se deba al azar. Para todas las ecuaciones de regresión calculadas el grado de significación es menor que 0.0001, por lo que se rechaza la hipótesis nula y se concluye que el predictando y los predictores están relacionados y tiene sentido plantearse la predicción del uno a partir de los otros.

En la Tabla 2 se muestran los resultados de una evaluación realizada para la temperatura máxima aprovechando los resultados de la campaña de incendios del año 1994. EM es el error medio, EAM es el error absoluto medio y DS es la desviación standard.

Predictando
EM
EAM
DS
N. CASOS
Llanes
0.371
1.095
1.501
21
Tama
1.204
2.347
2.986
49
Echevarría
0.720
2.400
3.072
50
Eibar
0.225
2.775
3.480
20
Evaluación de la predicción. Julio-Agosto 1994
Predictor
EM
EAM
DS
N. CASOS
Oviedo
1.143
2.053
2.689
49
Santander
-0.133
1.504
1.875
49
Vitoria
-0.602
3.357
4.056
49
Sondica
0.182
2.434
2.999
50
Fuenterrabía
-0.598
2.182
2.844
50
Evaluación de la predicción. Julio-Agosto 1994

Tabla 2: Resultados evaluación temperatura máxima.

4.    Conclusiones.

Para todas las ecuaciones de regresión calculadas el grado de significación es menor que 0.0001, lo que significa que tiene sentido plantearse la predicción del predictando a partir de los predictores.

Aunque la evaluación se ha realizado sobre una pequeña muestra y sólo para la temperatura máxima, los resultados son satisfactorios ya que los errores de los predictandos son similares y en algunos casos inferiores a los de los predictores.

Una de las ventajas de este método es su sencillez, ya que las ecuaciones de regresión se programan fácilmente automatizándose el proceso y facilitando la operatividad.

    Referencias.

Arasti E, Arteche J. 1996. Pronóstico de temperaturas extremas en el ámbito regional. Nota Técnica N. 5. S.E.D. CMT de Cantabria y Asturias. Instituto Nacional de Meteorología.

Ayuso J.J. 1994. Predicción estadística operativa en el INM. Publicación B-34 del Instituto Nacional de Meteorología.


Indice Sesi≤n Posters

Indice General