Original paper

Object Features for Pixel-based Classi cation of Urban Areas Comparing Different Machine Learning Algorithms

Wolf, Nils

Abstract

Image segmentation is a means to extract valuable spatial descriptors from urban remote sensing images. These descriptors (object features) can be concatenated at the pixel level to the spectral feature vector. Resulting spatial-spectral input spaces become more complex, but it is assumed that they offer in conjunction with appropriate classification techniques a better discrimination of classes. Comparing different supervised learning algorithms, this study empirically evaluates the value of adding object-based features into per-pixel classification. The considered algorithms are decision tree, decision tree ensembles (bagging and random forest), support vector machines (linear and rbf kernel), and k-nearest neighbour. The pixel level is suggested as the preferable domain for accessing object features in order to facilitate unbiased training, tuning and testing of algorithms within an implemented nested cross-validation scheme. Different case studies of urban remote sensing are considered to conduct the experiments, namely building detection with hyperspectral data (CASI) and aerial photography (Leica RC30), the mapping of pools, turf grass and non-turf vegetation in an urban tourist area using WorldView-2 panchromatic data, urban land cover classification using a hyperspectral benchmark dataset (ROSIS) and the classification of urban tree species (CASI). The results show that spatial features derived from segmentation levels have a great value for these applications. Concerning the algorithm performance, decision tree ensemble and support vector machine approaches yield in overall better results than decision tree and k-nearest neighbour.

Kurzfassung

Die Bildsegmentierung ermöglicht es, aus urbanen Fernerkundungsszenen wichtige räumliche Deskriptoren zu extrahieren. Diese Deskriptoren (Objektmerkmale) können auf Pixelebene mit dem spektralen Merkmalsvektor kombiniert werden. Resultierende räumlich-spektrale Merkmalsräume sind komplexer, aber es wird vermutet, dass sie in Verbindung mit angemessenen Klassi zierungstechniken eine bessere Trennung von Klassen ermöglichen. Im Vergleich verschiedener überwachter Lernalgorithmen untersucht diese Studie empirisch den Wert von objektbasierten Merkmalen für die pixelbasierte Klassi zierung. Die untersuchten Algorithmen sind decision tree, decision tree ensembles (bagging und random forest), support vector machines (linear und rbf kernel) und k-nearest neighbour. Die Pixelebene ist dabei als bevorzugte Domäne für das unverzerrte Trainieren, Tunen und Testen der Algorithmen innerhalb einer verschachtelten Kreuzvalidierung anzusehen. Für die Durchführung der Experimente werden verschiedene Fallstudien urbaner Fernerkundung berücksichtigt, namentlich Gebäudedetektion sowohl mit Hyperspektralscanner-Daten (CASI) als auch Luftbildern (Leica RC30), Kartierung von Swimmingpools, Rasen ächen und Baum-/Strauchvegetation in einer touristisch geprägten urbanen Region mit panchromatischen WorldView-2 Daten, Klassi zierung urbaner Landbedeckung mit einem hyperspektralen Benchmark-Datensatz (ROSIS) und die Klassi zierung urbaner Baumarten (CASI). Die Ergebnisse zeigen, dass die aus Segmentierungsebenen extrahierten räumlichen Merkmale für diese Anwendungsbeispiele einen bedeutenden Mehrwert haben. Hinsichtlich des Algorithmenvergleichs lieferten decision tree ensembles und support vector machinesübergreifend deutlich genauere Ergebnisse als decision tree und k-nearest neighbour.

Keywords

urban remote sensingmachine learningobject-based feature extractionspatial-spectral classification