Original paper

Optimization of long-term air quality modelling applying cluster analysis techniques

Panitz, Hans-Jürgen

Meteorologische Zeitschrift Vol. 19 No. 1 (2010), p. 63 - 80

published: Feb 1, 2010

DOI: 10.1127/0941-2948/2010/0419

BibTeX file

ArtNo. ESP025011901005, Price: 29.00 €

Download preview PDF Buy as PDF

Abstract

A methodology to classify atmospheric conditions is provided which can be applied efficiently for studies of long-term air quality. It is shown that statistical air quality indicators like average and mean daily maximum concentrations of air pollutants, percentiles, and, with respect to ozone, risk indicators like AOT40 and SOMO35, can be calculated with sufficient accuracy if they are based on modelled concentration data that are calculated only for a few representative meteorological conditions resulting from the classification. The aim of the project was the development of an efficient classification and analysis tool and the demonstration of its general applicability. For the classification, daily meteorological conditions of only one year, namely the year 2000, have been considered. These have not been derived from analysis data or synoptic observations, but from the results of the large-scale model EURAD. Two different classification techniques have been applied, the “classical” cluster analyses using the WARD and K-MEANS methods, and Kohonen's “Self Organizing Maps” (SOM). The statistical air quality indicators that were derived using the classification system have been compared with corresponding reference quantities calculated from the results of a continuous annual simulation with the meso-scale Chemistry-Transport-Model (CTM) KAMM/DRAIS. The reference air quality indicators derived from these detailed simulation have also been compared with corresponding values calculated from measurements. The classification of the meteorological conditions of the whole year gave 19, 20, and 21 classes applying the WARD, K-MEANS, and SOM methods, respectively. AOT40 is defined for the periods from April until September and May until July. Therefore, further classifications have been performed for these two periods. Generally, it can be stated that, with only a few exceptions, the difference between statistical measures derived from cluster solutions and detailed simulations are less than ±10 %. The only exceptions are for NO and SOMO35. With respect to NO the differences related to the annual mean and the 90-percentile were larger than ±10 % considering all clustering methods. With respect to SOMO35 the difference was larger than 10 % for all statistical quantities when the SOM was applied. Assessing the efficiency of the classification methods and whether the resulting classes represent the whole spectrum of possible meteorological conditions, the K-MEANS and WARD methods best fulfilled these criteria.

Kurzfassung

Es wird eine Methode zur Klassifizierung von meteorologischen Bedingungen vorgestellt, die effektiv in Studien zur Langzeitluftqualität angewendet werden kann. Es wird gezeigt, dass statistische Luftqualitätsindikatoren, wie z.B. Mittel- und Maximalwerte der Konzentrationen von Luftschadstoffen, Perzentile und mit Bezug auf Ozon Risikoindikatoren wie AOT40 und SOMO35 mit guter Genauigkeit berechnet werden können, wenn sie auf der Basis von modellierten Konzentrationsverteilungen ermittelt werden, die selbst nur auf einigen wenigen repräsentativen meteorologischen Bedingungen beruhen. Diese repräsentativen Bedingungen resultieren aus der Klassifizierung der atmosphärischen Situationen. Es war das Ziel des Projektes, das Klassifizierungs- und Analysewerkzeug zu entwickeln und seine Anwendbarkeit zu demonstrieren. Für die Klassifizierung wurden die täglichen meteorologischen Bedingungen nur eines Jahres, und zwar des Jahres 2000, betrachtet. Diese wurden allerdings nicht aus Analysen oder synoptischen Beobachtungen abgeleitet, sondern aus den Ergebnissen des großskaligen Modells EURAD. Zwei unterschiedliche Klassifizierungstechniken wurden verwendet, die “klassische” Clusteranalyse mit den WARD und K-MEANS Methoden sowie Kohonen's “Self Organizing Maps” (SOM). Die statistischen Luftqualitätsindikatoren, die auf den Ergebnissen des Klassifizierungssystems basierten, wurden mit entsprechenden Referenzwerten verglichen, die aus den Ergebnissen einer kontinuierlichen Jahressimulation mit dem mesokaligen Chemie-Transport-Modell (CTM) KAMM/DRAIS abgeleitet wurden. Diese Referenzwerte wurden außerdem mit Werten verglichen, die aus Beobachtungen bestimmt wurden. Die Klassifizierung der täglichen meteorologischen Bedingungen des ganzen Jahres ergab 19 Cluster für die WARD Methode, 20 für K-MEANS und 21 für die SOM Technik. Da die AOT40 nur über die Zeiträume von April bis September bzw. von Mai bis Juli definiert sind, wurden weitere Klassifizierungen für diese Perioden durchgeführt. Allgemein lässt sich sagen, dass, mit wenigen Ausnahmen, die statistischen Kenngrößen, die anhand der Klassifizierungen ermittelt wurden, bis auf ±10 % mit denen übereinstimmten, die aus der Detailsimulation berechnet wurden. Die Ausnahmen betreffen NO und SOMO35. Für NO wurden der Jahresmittelwert und das 90-Perzentil von allen Klassifizierungslösungen um mehr als ±10 % überschätzt. Für SOMO35 liefert nur das SOM Verfahren Abweichungen größer 10 %. Beurteilt man die Klassifizierungsmethoden hinsichtlich ihrer Effektivität sowie der Repräsentativität der gefundenen Klassen, dann erfüllen die WARD und K-MEANS Methoden diese Kriterien am besten.