Original paper

A New Binary Encoding Algorithm for the Simultaneous Region-based Classification of Hyperspectral Data and Digital Surface Models

Xie, Huan; Heipke, Christian; Lohmann, Peter; Soergel, Uwe; Tong, Xiaohua; Shi, Wenzhong

Abstract

In this paper, an approach is proposed to integrate hyperspectral image data, object and height information into a new region-based binary encoding algorithm for automatically deriving land cover information. After georeferencing the different data sets and deriving a normalized digital surface model (nDSM), connected regions are extracted from the hyperspectral data by applying an edge-based segmentation algorithm. The mean spectrum per region is considered representative for the region. Five parameters are defined to describe the size and shape of the region, namely area, asymmetry, rectangular fit, ratio of length to width, and compactness. Together with the spectral information these parameters and the corresponding height values per region from the nDSM are converted into a binary code. This code is then matched to that of a training data set for classification. In order to evaluate the suggested approach we applied it to a test area in Oberpfaffenhofen, Germany. A manually generated classification served as reference. We also compare our result with the well known support vector machine (SVM) classifier. Based on our test data, we could show that the inclusion of size, shape, and height improves the classification accuracy of binary encoding. We could also show that the new method obtained more accurate and more efficient results when compared to the SVM classification.

Kurzfassung

In diesem Artikel schlagen wir einen neuen Ansatz zur automatischen Klassifikation der Landbedeckung durch Integration hyperspektraler Bilddaten mit Höheninformation vor. Der Ansatz setzt auf einer Segmentierung der Bilder auf und beruht auf der Binärkodierung. Nach der Georeferenzierung der verschiedenen Datensätze und der Ableitung eines normalisierten Digitalen Oberflächenmodels (nDOM) werden die Hyperspektraldaten mit Hilfe eines kantenbasierten Verfahrens segmentiert. Das mittlere Spektrum wird jeweils als repräsentativ für das gesamte Segment betrachtet. Fünf Parameter beschreiben die Größe und Form jedes Segments: Fläche, Asymmetrie, Rechteckigkeit, Verhältnis von Länge zu Breite und Kompaktheit. Diese Parameter werden zusammen mit der spektralen Information und der Höhe aus dem nDOM in einen Binärcode transformiert, der dann dem entsprechenden Binärcode von Trainingsgebieten zugeordnet wird. Zur Evaluierung des neuen Ansatzes wurden Tests mit einem Datensatz aus Oberpfaffenhofen durchgeführt, eine per Hand erstellte Klassifikation diente dabei als Referenz. Wir haben unsere Ergebnisse auch mit denen einer Support Vector Machine (SVM) verglichen. Für unser Testgebiet konnten wir zeigen, dass die Berücksichtigung von Größe, Form und Höhe die Ergebnisse im Vergleich zur standardmäßigen Binärklassifikation verbessert, dabei hat die neue Methode auch im Vergleich zu dem SVM Ansatz genauere Ergebnisse geliefert und war darüber hinaus deutlich schneller.

Keywords

hyperspectral imagesdsmbinary encodingregion-based classificationintegration