Se presenta una metodología para generar clasificaciones atmosféricas con significación meteorológica (diferentes tipos, diferentes efectos en superficie). Posteriormente, se aplica para generar una clasificación sinóptica para España. La "óptima" significación meteorológica y "mínima subjetividad" de las clasificaciones generables con esta metodología, se deben a un enfoque novedoso: primero se aplica un proceso de clustering a los repartos diarios de efectos en superficie, y se genera una clasificación por efectos; los tipos atmosféricos se obtienen, posteriormente, a partir de las configuraciones de los días de cada tipo de efectos. La clasificación generada presenta gran estabilidad frente al incremento del número de días agrupados.
1. Introducción.
El objetivo final de este trabajo es profundizar en el conocimiento de las relaciones entre configuraciones atmosféricas y efectos en superficie. Este objetivo se enmarca dentro de una estrategia más general del S.A.I.C., de obtención de escenarios climáticos futuros. Para conseguirlo, se desarrolla una herramienta analítica: una clasificación sinóptica con significación meteorológica. Esta herramienta se ha orientado al análisis climático, pero tiene aplicación en otros campos, incluido el de apoyo a la predicción.
Cualquier metodología analítica implica una partición del material de estudio. En este caso, el material de estudio lo constituyen conjuntos o poblaciones de configuraciones atmosféricas diarias, y de campos diarios de efectos en superficie (por ejemplo, campos diarios de precipitación). Una partición de dichas poblaciones lleva a generar una clasificación. De lo anterior se deduce que una clasificación es una herramienta para facilitar el análisis de algo, en este caso, el análisis de las relaciones entre la circulación atmosférica sobre la Península y sus efectos en superficie. Por otro lado, una clasificación depende del criterio de agrupación utilizado. Diferentes criterios generan clasificaciones muy diferentes de los mismos elementos.
2. Clasificaciones sinópticas. Antecedentes.
Existen para España bastantes trabajos de clasificación y/o tipificación de situaciones atmosféricas, con distinto grado de sistematización.
2.1. Clasificaciones no automatizadas.
Tradicionalmente denominadas "subjetivas", en ellas, el investigador determina los tipos sinópticos en base a su experiencia, y los días se asignan a cada tipo por inspección visual de mapas. Se denominaban así por oposición a las llamadas "objetivas", pero aún estas tienen cierto grado de subjetividad, por lo que se considera más adecuado hablar de "no automatizadas/automatizadas". En este ámbito citamos los trabajos de Font Tullot (1983), Linés (1981), Sánchez Rodríguez (1993), Clavero y Raso (1979), Florit y Jansá (1980).
Su valor es indudable, sobre todo descriptiva y conceptualmente. Pero presentan algunas limitaciones para su empleo operativo o en investigación:
- No existen publicaciones de períodos largos clasificados, como ocurre en el
Reino Unido, con la clasificación de tipos de tiempo de Lamb (Lamb, 1972), o en Alemania con el Grossweterlagen del Servicio Meteorológico Alemán.
- Además, requieren una inspección visual para su aplicación, lo que casi imposibilita la clasificación de grandes cantidades de días. Esto es de gran importancia si se trabaja con salidas de Modelos de Circulación General, utilizados cada vez más en investigación climática.
2.2. Clasificaciones automatizadas.
Los tipos sinópticos se determinan mediante un proceso de clustering automático, y la asignación de días se hace por ordenador. Tradicionalmente, el proceso de clustering se ha aplicado directamente a las configuraciones atmosféricas: el criterio de agrupación ha sido el parecido morfológico entre configuraciones diarias. Recientemente se han concluido algunos trabajos con este enfoque, por compañeros del INM (Calvo, 1993), (Petisco y Martín, 1995). Esta aproximación "clásica" presenta, a nuestro entender, dos problemas:
- Algunos sistemas sinópticos no presentan, en parte, ubicaciones preferentes, por lo que en general no hay fronteras nítidas entre los tipos sinópticos asociados, de modo que la separación entre tipos debe establecerse de forma más o menos arbitraria.
- Al no incluir ningún criterio discriminador de efectos en superficie en el proceso de clustering, la significación meteorológica de la clasificación generada, en principio, no tiene por que ser óptima. Se dice "en principio" porque el investigador puede y debe ajustar los parámetros del proceso para obtener una clasificación meteoro-"lógica".
3. Una aproximación novedosa.
Para aminorar los problemas descritos, se planteó como objetivo desarrollar una metodología para generar clasificaciones con las características de:
- ser automatizadas.
- tener significación meteorológica (diferentes tipos de configuraciones atmosféricas / diferentes efectos en superficie).
- que las poblaciones sobre las que se aplica el proceso de clustering presenten en lo posible clusters naturales.
Para ello se abordó el problema desde una perspectiva novedosa. La clasificación sinóptica se determina, de forma indirecta, en dos pasos:
a) El proceso de clustering que se aplica, no a las configuraciones atmosféricas directamente, sino a los campos diarios de efectos en superficie (en este caso a los campos diarios de precipitación acumulada).
b) Una vez preclasificados los días por sus efectos en superficie, se determinan los tipos sinópticos analizando las configuraciones atmosféricas de los días pertenecientes a cada patrón de reparto de efectos.
Este nuevo enfoque presenta 3 ventajas destacables:
i) Los tipos sinópticos generados tendrán en principio óptima predictividad del efecto en superficie utilizado en su génesis, por haberse determinado a partir de días con repartos del mismo muy similares. Es decir, se obtendrán clasificaciones con alta significación meteorológica.
ii) Los repartos de efectos, en especial para la precipitación, presentan fronteras claras, debido a la influencia de la topografía, principalmente de las cordilleras, y por ello aparecen clusters naturales. Para ilustrar lo anterior, considérese la influencia que ejerce la Cordillera Cantábrica al determinar dos repartos de precipitación claramente diferentes en función de que el flujo tenga componente sur (ver Fig. 2.2, patrón 7) o norte (patrón 8). En el "momento" en que la evolución de una configuración similar a la del patrón 7, haga que el flujo pase de tener componente sur a tener componente norte, habrá un salto más o menos brusco de este al otro patrón de precipitación. Estos saltos bruscos hacen que haya clusters naturales. Así,
habrá un gran número de días con un reparto de precipitación similar al patrón 7, y otros muchos, similar al 8, pero, en cambio, habrá pocos días con patrones intermedios. Por ello, el proceso de clustering podrá distinguir entre estos tipos de forma automática. Esta idea intuitiva de la existencia de clusters naturales, se confirmó posteriormente, al comprobar que éstos aparecían casi idénticos en los muchos procesos de clustering probados, utilizando distintos métodos, e incluso variando significativamente sus parámetros.
iii) La definición de los tipos atmosféricos a partir de las configuraciones de días preclasificados por efectos, permite su caracterización mediante campos diferentes (presión a nivel del mar (P1013); geopotencial 500 hPa (Z500); gradientes de los anteriores; temperaturas; vector Q...; varios de los anteriores...), con muy poco esfuerzo adicional, ya que no hay que aplicar a esos campos el proceso de clustering. Igualmente, pueden obtenerse también clasificaciones de configuraciones a escalas diferentes -sinóptica, mesoescala ...-, variando la resolución de los datos atmosféricos con que se trabaja.
4. Aplicación de la metodología para generar una clasificación de repartos de precipitación y una sinóptica, para España.
4.1. Preparación del banco de datos de superficie.
Se ha construido un banco de datos reticulares de precipitación acumulada diaria, por interpolación espacial, a partir del banco de datos diarios del INM para el período 1961-90 (más de 7000 observatorios). La rejilla tiene un brazo de red de 61km lat. x 51km lon., con 203 puntos sobre la Península y Baleares (ver Fig. 1). Se consiguen con ello tres objetivos:
- Garantizar un reparto espacial homogéneo de los datos, ya que el vector de 203 componentes representa equilibradamente todo el territorio.
- Obtener series temporales con dato continuo, sin lagunas.
- Disminuir el ruido o comportamiento local de los datos. Para ello se ha utilizado un método de interpolación espacial no exacto. Cada nudo es representativo de una zona y no de un punto. Esta resolución busca captar el detalle comarcal o subregional de los patrones de precipitación, no el local.
Se obtiene pues, a partir de un banco de datos locales de estructura espacial y temporal inhomogéneas, una nueva base sin ruido local, con distribución espacial regular, y sin lagunas temporales.
4.2. Preparación del banco de datos atmosféricos.
Se han utilizado los datos de análisis atmosféricos realizados cada 12 horas, contenidos en el CD-ROM denominado "National Meteorological Center (NMC) Northern Hemisphere Grid Data Set". Se trata de los análisis finales del centro de predicción estadounidense NMC. Por su extensión temporal (datos diarios desde 1945 en algunas variables), número de variables, bajo precio, compacidad y facilidad de uso, es muy recomendable el uso de esta base de datos para cualquier investigador de fenómenos a escala sinóptica (información vía FTP: NCARDATA.UCAR.EDU). Se han interpolado los datos de la red original a una rejilla rectangular con 120 puntos, de paso 3. lat. x 4. lon. (Fig. 1). Las variables disponibles son:
- Alturas de geopotencial en 850 hPa, 700 hPa, 500 hPa y 200 hPa.
- Presión reducida a nivel del mar.
- Viento en 850 hPa y 250 hPa.
- Temperatura en 850 hPa y 700 hPa.
4.3. Obtención de la clasificación de repartos de precipitación.
En primer lugar, deben definirse los tipos o patrones de precipitación, y posteriormente, asignar cada día del período a clasificar a uno de estos tipos.
4.3.1. Tipificación de repartos de precipitación.
Consiste en determinar los tipos de reparto de precipitación, que en adelante se denominarán "semillas". Para ello, hay que seleccionar un buen método de clustering. Un proceso de clustering queda definido por una estrategia de agregación y por una medida de similitud entre individuos a clasificar (Júdez, 1989), y por las variables elegidas para representar esos individuos. La selección y descripción de cada factor se detallan en Ribalaygua y Borén (1995). Aquí se resumen las opciones finalmente adoptadas:
a) La estrategia de agregación seleccionada fue una modificación del Método de Petisco y Martín (Petisco y Martín, 1995), que dio desde el principio excelentes resultados, y que en nuestra opinión, resulta muy interesante. Este método modificado detecta las zonas de "alta densidad" del campo de datos, es decir los campos que superan cierto umbral de similitud con un mayor número de elementos del banco de datos (campos de días reales). Su funcionamiento, a grandes rasgos, es el siguiente:
i) Construye, para cada día, un grupo, siguiendo un proceso que:
i.a) asigna a ese día todos aquellos otros cuya similitud con él supere un cierto umbral UMB1,
i.b) calcula el centroide del grupo así formado, como promedio de campos de los días agrupados,
i.c) reasigna al centroide todos los días cuya similitud con él supere UMB1,
i.d) repite b) y c) hasta que el grupo formado sea estable.
La reasignación consigue que los centroides se vayan desplazando hacia las zonas de "alta densidad", hasta detectarse el centroide de máxima "densidad" relativa. Esto hace que muchos días tengan asociado un mismo grupo, pues sus centroides se han ido desplazando hacia un mismo máximo relativo. Esta idea de la reasignación, y el consiguiente desplazamiento de centroides, es lo que hace de este método una herramienta inestimable para detectar grupos compactos de días muy similares (los referidos clusters naturales).
ii) Ordena los días del período por número de elementos que constituyen su grupo. Selecciona primero el grupo con mayor número de días (el máximo absoluto de "densidad"). Posteriormente va descendiendo en la ordenación, y seleccionando los grupos que no sean excesivamente similares a los previamente seleccionados (es decir, que los centroides no superen cierto umbral UMB2 de similitud entre si).
La repetición de este proceso, utilizando diferentes valores de UMB1, genera diferentes conjuntos de semillas. Muchas semillas, como se ha dicho, aparecían casi idénticas en todos los conjuntos, indicando la existencia de clusters naturales. El proceso finaliza con la selección de las semillas definitivas, en base a ciertos criterios predefinidos (Ribalaygua y Borén, 1995).
b) Los individuos a clasificar se representaron finalmente por los coeficientes de 22 componentes principales rotadas oblicuamente, obtenidas a partir de las 203 variables originales, cuya varianza explicaban en un 87%.
c) Como medida de similitud, se eligió el coeficiente de correlación ponderado por la varianza explicada por cada componente principal. Esta medida es más efectiva que la distancia euclídea si se busca detectar parecidos en las formas, más que en los niveles de precipitación.
Una vez seleccionado el método de clustering (método de agregación, representación de los individuos y medida de similitud), se aplicó a los 10.957 días del período 1961-90, determinándose las 18 semillas definitivas (Fig. 2.1, 2.2 y 2.3), que pretenden abarcar conjuntamente el espectro de patrones conocidos por la experiencia.
Figura 2.2: Semillas 7 a 12 (campos medios de los días que las
constituyen). A) Reparto de precipitación (mm); B) Presión a nivel
del mar (hPa); C) Geopotencial de 500 hPa (m).
Figura 2.3: Semillas 13 a 18 (campos medios
de los días que las constituyen).
A) Reparto de precipitación (mm); B) Presión a nivel del mar (hPa); C) Geopotencial de 500 hPa (m).
4.3.2. Clasificación del período 1961-90, por repartos de precipitación.
Cada día se asigna a la semilla que le sea más similar, usando la misma medida de similitud entre campos de precipitación y la misma representación de los mismos que en el proceso de clustering. La clasificación así obtenida es completa, sin días inclasificados, aunque discrecionalmente pueden dejarse sin clasificar días que no superen cierta similitud con ningún tipo.
4.4. Obtención de la clasificación sinóptica.
Consta de tres fases diferenciadas:
4.4.1. Tipificación sinóptica.
Los tipos sinópticos se obtienen analizando los campos atmosféricos de los días pertenecientes a cada patrón de precipitación. Se han utilizado para definirlos las variables P1013 y Z500, por la información que contienen sobre forzamientos que determinan la precipitación: flujos en la troposfera baja y forzamiento dinámico de la troposfera media. Además, tienen las ventajas adicionales de su uso tradicional en climatología sinóptica y de la existencia de bancos de datos de mayor calidad y extensión temporal.
En primera aproximación, se han obtenido 18 tipos sinópticos como promedio de los campos de P1013 y Z500 de los días pertenecientes a cada "semilla" (Fig. 2.1, 2.2 y 2.3).
4.4.2. Determinación de la medida de similitud entre configuraciones atmosféricas.
La medida de similitud seleccionada evalúa el parecido entre los flujos geostróficos a nivel del mar y 500 hPa, ponderando los valores en los puntos de la rejilla en función de su distancia a la Península. El proceso de selección de la medida y sus características se describen en Borén, Ribalaygua y otros (1995). Se calcula el coeficiente de correlación entre los campos de gradiente zonal de presión en superficie en cada punto de rejilla, de los dos días a comparar. Se procede análogamente para el gradiente meridional, y también para los gradientes zonal y meridional de altura de geopotencial de 500 hPa. La medida de similitud es el promedio de los cuatro coeficientes.
4.4.3. Clasificación del período 1961-90, por configuraciones sinópticas.
Cada día se asigna al tipo sinóptico más similar a la configuración de ese día, usando la medida de similitud seleccionada. La clasificación sinóptica obtenida es completa, pero podría igualmente haberse hecho incompleta.
4.5. Resultados.
4.5.1. Tipos conceptualmente lógicos.
Los 18 patrones de precipitación, y los tipos sinópticos asociados, son todos conceptualmente lógicos en sus relaciones causa-efecto (Fig. 2.1 a 2.3).
El tipo 1 (ausencia de precipitación) presenta predominio de altas presiones en P1013 y una dorsal en Z500 afectando a toda la Península y Baleares, que determinan una estabilidad total.
El tipo 7 (precipitaciones en Galicia) presenta en P1013 flujo ciclónico del O-SO sobre Galicia, mientras el resto de la fachada atlántica peninsular esta bajo los efectos de una cuña anticiclónica que impide las precipitaciones. La ligera componente Sur del flujo determina la ausencia lluvias en la Cornisa Cantábrica. El tipo 4, en cambio, no presenta esa cuña, y las precipitaciones son generalizadas en la vertiente atlántica. El tipo 8 presenta lluvias en la costa cantábrica debido a la componente norte del flujo. El apantallamiento de la Cordillera Cantábrica afecta ahora a la Meseta Norte, y al resto del territorio nacional, que apenas reciben precipitaciones.
El campo de Z500 tiene gran importancia discriminatoria en los tipos que podríamos denominar "no frontales". Por ejemplo, en el tipo 15 (lluvias en el sudeste), el campo de P1013 presenta un flujo de levante que podría generar precipitaciones en cualquier punto de la costa mediterránea, y es la posición de la depresión en 500hPa la que determina la zona de precipitación (ascensos asociados a advección de vorticidad positiva). También este campo es el que discrimina entre los tipos 16, 17 y 18, de precipitaciones convectivas en el interior, caracterizados en general por bajas térmicas en sus campos de P1013.
4.5.2. Tipos estables frente al incremento de días agrupados.
Los campos medios tanto de reparto de precipitación como de P1013 y Z500, de los días pertenecientes a cada semilla, se mantienen prácticamente idénticos si se incrementa fuertemente el número de días agrupados. Esto se comprueba analizando los campos medios de los denominados "grupos" de precipitación, constituidos por los días asignados a cada semilla al hacer la clasificación completa del período 1961-90 (ver Fig. 3); y ello a pesar del notable incremento del número de días agrupados (por ejemplo, la semilla del tipo 7 está constituida por 111 días, y su grupo por 839; el tipo 18 pasa de 33 a 505 días). Esto mismo sucede para todos los demás tipos, lo que demuestra la estabilidad de la aproximación propuesta en la determinación de estos.
4.5.3. Significación meteorológica de la clasificación sinóptica.
La significación meteorológica se comprueba analizando si los días clasificados sinópticamente (por similitud entre sus configuraciones atmosféricas y los 18 tipos sinópticos obtenidos), se mantienen en los tipos en que fueron clasificados por efectos (por similitud entre sus repartos diarios de precipitación y las 18 semillas). Es decir, se intenta comprobar la capacidad de la clasificación sinóptica para discriminar efectos en superficie. Para ello, se calcula el promedio de los campos de precipitación de los días de cada grupo sinóptico, constituido por los días asignados a cada tipo sinóptico al hacer la clasificación sinóptica completa del período 61-90, y se compara con el campo promedio del grupo de precipitación. El resultado es bueno para los tipos netamente frontales, con gran parecido tanto en las formas como en el número de días agrupados (Fig. 3, tipo 7). Pero para otros tipos, los resultados son peores, en especial para los convectivos (tipo 18). El motivo puede ser que algunos tipos sinópticos deben ser la media de dos o más configuraciones bastante diferentes, pero que generan efectos similares. Esto parece suceder en el tipo anticiclónico, por ejemplo. Y esa imprecisa definición de este tipo sinóptico hace que, al clasificar sinópticamente, muchos días sin precipitaciones se asignen a otros tipos, en especial a los convectivos, suavizando sus promedios de precipitación.
4.5.4. Posibles mejoras de la metodología.
Para incrementar la significación meteorológica de la clasificación sinóptica, se plantea la conveniencia de aplicar un proceso de clustering ulterior sobre configuraciones atmosféricas diarias (es decir, siguiendo ahora el enfoque "clásico"), a cada grupo de precipitación por separado. También se considera adecuado incluir otros campos, que favorezcan la significación meteorológica (inestabilidades termodinámicas, advecciones de vorticidad, etc.). Por último, se considera adecuado continuar investigando para incrementar la eficiencia de la medida de similitud entre los campos finalmente seleccionados.
5. Aplicaciones.
a) Esta metodología se ha diseñado para su aplicación a la investigación climática, como se ha dicho. En ese campo, las clasificaciones ya generadas pueden ser muy útiles para analizar y definir climatologías del pasado (distribución anual de tipos, variabilidad interanual, explicación de períodos secos o húmedos...). También ofrecen claras aplicaciones en la simulación de climas futuros, como herramienta de validación de Modelos de Circulación General (estudiando si generan adecuadamente el clima actual sobre España),
y de posterior generación de escenarios climáticos de alta resolución.
b) La metodología propuesta, con este enfoque novedoso, digamos "inverso" (a partir de los efectos), puede aplicarse para generar clasificaciones como las descritas, pero partiendo de otras variables (en especial, temperaturas), para asegurar su capacidad discriminante respecto a esas variables.
c) Su utilidad más interesante en predicción nace de la posibilidad de aplicar de la metodología a mayor resolución. Puede hacerse una clasificación de efectos en superficie con detalle local, y, a partir de ella, una de configuraciones atmosféricas, que podrían tener incluso detalle de circulaciones mesoescalares. Esta clasificación "mesoescalar" podría aplicarse a las configuraciones predichas por el LAM del INM, que se muestra fiable para esta mesoescala, y constituir una valiosa herramienta de pronóstico a la predicción de efectos a escala local. Un enfoque similar utilizan Sumner, Guijarro y otros (1995), en un interesante trabajo para Palma de Mallorca.
Referencias.
Borén, R., J. Ribalaygua y L. Balairón, 1995. Método analógico de simulación de escenarios climáticos a escala comarcal. Informe N.4 del Servicio de Análisis e Investigación del Clima, I.N.M., Madrid.
Calvo, J. 1993. Clasificación de flujos en 500 hPa sobre la Península Ibérica. Nota técnica N. 32 del Servicio de Predicción Numérica, I.N.M.
Clavero, L. y J.M. Raso, 1979. Catálogo de tipos sinópticos para un estudio climatológico del Este de la Península Ibérica y Baleares. Aportacions en homenatge al geógraf Salvador Llobet, University of Barcelona, pp.63-86.
Florit, J. y A. Jansá, 1980. Situaciones de presión en el Mediterráneo occidental. Repercusiones sobre el tiempo en Menorca y en el resto de España. Trabajos de Geografía, 35, 57-84 (Universidad de les Illes Balears)
Font Tullot, I. 1983. Climatología de España y Portugal. Instituto Nacional de Meteorología. Ministerio de Transportes, Turismo y Comunicaciones. Madrid.
Júdez, L. 1989. Técnicas de análisis de datos multidimensionales. M. de Agricultura Pesca y Alimentación, Madrid.
Lamb, H.H. 1972. British Isles weather types and a register of daily sequences of circulation patterns, 1861-1971. Geophysical Memoir 116, HMSO, London.
Linés, A. 1981. Perturbaciones típicas que afectan a la Península y precipitaciones asociadas. Publicaciones del I.N.M., serie A, N. 80. Madrid.
Petisco, E. y J.M. Martín, 1995. Caracterización de la Circulación General Atmosférica en la Península Ibérica y Baleares. Informe N.5 del Servicio de Análisis e Investigación del Clima. I.N.M., Madrid.
Ribalaygua, J. y R. Borén, 1995. Clasificación de patrones espaciales de precipitación diaria sobre la España Peninsular y Baleárica. Informe N.3 del Servicio de Análisis e Investigación del Clima, I.N.M., Madrid.
Sánchez Rodríguez, J. 1993. Situaciones Atmosféricas en España. Serie de monografías. MOPT. Instituto Nacional de Meteorología. Madrid.
Sumner, G., J.A. Guijarro and C. Ramis, 1995. The impact of surface circulation on significant daily rainfall patterns over Mallorca. International Journal of Climatology, vol. 15, pp.673-696.
Agradecimientos.
Se agradece la colaboración al Centro de Proceso de Datos de la Universidad Complutense de Madrid, por las facilidades prestadas en la utilización de sus medios informáticos, y a todo su personal, por su gran disposición y por la asesoría teórica y práctica prestada en todo momento y con gran eficacia, sin cuya colaboración ejemplar este proyecto se hubiera visto muy dificultado. Se agradece en especial la asesoría en programación de D. Pedro Cuesta.
Del mismo modo se agradece la colaboración del personal del Servicio de Análisis e Investigación del Clima: D. Eduardo Petisco, D. José María Martín, D. Javier López y D. Javier Rodríguez Izcara. En especial, la cesión del programa desarrollado por D. Eduardo Petisco, que ha sido de enorme utilidad. Así mismo, se agradece la asesoría y el apoyo de D. Ricardo Riosalido, Jefe del Servicio de Técnicas y Análisis de Predicción.
Se agradece a D. Ángel Fernández Cancio y a D. José Luis Allué, del Instituto Nacional de Investigaciones Agrarias, la asesoría técnica y la confianza personal depositada.