基於多源遙感數據的海南島天然林分類數據集

基於多源遙感數據的海南島天然林分類數據集
作者:史建康 宮晨 李新武 萬祥星
2019年5月9日
本作品收錄於《中國科學數據
史建康, 宮晨, 李新武, 等. 基於多源遙感數據的海南島天然林分類數據集[J/OL]. 中國科學數據, 2019, 4(2). (2019-03-29). DOI: 10.11922/csdata.2018.0091.zh.


摘要&關鍵詞

編輯

摘要:熱帶森林是全球物種最為豐富的森林生態系統,主要分布在赤道附近的熱帶氣候區域,在全球氣候變化中發揮着重要作用。因此,對熱帶森林進行資源調查及監測具有十分重要的意義,其中天然林的分類研究不僅能夠為熱帶森林的調查提供數據支持,也能夠為森林的物種多樣性研究提供依據。本數據集利用Sentinel-1A衛星提供的雙極化SAR數據和Landsat-8衛星提供的光學遙感數據對海南島熱帶天然林進行了分類研究。首先通過分析光學遙感數據的單波段特徵、多波段特徵、歸一化植被指數(NDVI)以及SAR數據的單時相、多時相後向散射特徵,選取了適合天然林分類的光學特徵和後向散射特徵。隨後利用選取的光學特徵和後向散射特徵,採用支持向量機(Support Vector Machine,SVM)分類算法對海南島的天然林範圍進行提取,在此基礎上對其內部林型進行分類,將其分為典型熱帶雨林、熱帶季雨林、常綠針葉林、落葉闊葉混交林以及海岸林5種森林類型。此外,結合野外實地採集的驗證數據以及海南林業調查資料對分類結果進行精度驗證和評價,其中利用支持向量機分類精度達到了80%以上。本數據集為海南島熱帶天然林分類提供了可靠的遙感分類方法,同時對於其他地區的熱帶天然林分類研究具有一定的參考價值。

關鍵詞:多源遙感數據;熱帶森林;遙感分類;支持向量機

Abstract & Keywords

編輯

Abstract: Widely distributed in the vicinity of the equator, tropical forest is one type of forest with the most abundant species worldwide which has a profound effect on global climate change. Therefore, it is of great significance for a country to develop the forest resources inventory and perform dynamic monitoring. Research on the classification of natural forests not only supports the investigation of tropical forests, but also provides the basis for the study of forest species diversity. The dual-polarized SAR data from Sentinel-1A sensor and the optical remote sensing data from Landsat-8 sensor were used for classification of Hainan island tropical natural forest. First, we analyzed the single-band, multi-band, normalized difference vegetation index (NDVI) characteristics of optical data, and the single-phase, multi-temporal backscattering characteristics of SAR data. Then, optical and backscattering characteristics were selected for natural forest classification whereby the natural forest range of Hainan Island was extracted by using support vector machine (SVM). The natural tropical forest was classified into five types: tropical rain forest, tropical monsoon forest, evergreen coniferous forest, deciduous broad-leaved mixed forest and coastal forest. The accuracy of classification results was verified and evaluated based on a combination of field survey data and Hainan forestry survey data. The overall accuracy of the classification exceeded 80%. The results provide a reliable remote sensing classification method for Hainan island tropical forest classification. This dataset also has some reference value for the study of tropical natural forest classification in other areas.

Keywords: multi-source remote sensing data; tropical forest; remote sensing classification; support vector machine (SVM)

數據庫(集)基本信息簡介

編輯
數據庫(集)名稱 基於多源遙感數據的海南島天然林分類數據集
數據作者 史建康、宮晨、李新武、萬祥星、孫中昶
數據通信作者 宮晨(gongchen@radi.ac.cn)
數據時間範圍 2015年
地理區域 北緯18°10′–20°10′,東經108°37′–111°03′
空間分辨率 30 m
數據量 1.20 GB
數據格式 *.bat, *.tif, *.shp, *.xml
數據服務系統網址 http://www.sciencedb.cn/dataSet/handle/711
基金項目 海南省重大科技計劃項目(ZDKJ2016021);海南省自然科學基金面上基金項目(20164177)。
數據庫(集)組成 數據集由2個壓縮包組成,文件以產品名命名: (1)Classification_of_Hainan_Island _Land_cover.zip是海南島土地初級利用分類產品數據,數據量約1.20 GB; (2)Classification_of_Hainan_Island _Natural_Forest.zip是海南島天然林分類產品數據,數據量約15.5 MB。

Dataset Profile

編輯
Title Classification of Hainan island natural forests based on multi-source remote sensing data
Data corresponding author Gong Chen (gongchen@radi.ac.cn)
Data authors Shi Jiankang, Gong Chen, Li Xinwu, Wan Xiangxing, Sun Zhongchang
Time range 2015
Geographical scope 18°10』N – 20°10』N, 108°37』E – 111°03』E
Spatial resolution 30 m
Data volume 1.20 GB
Data format *.bat, *.tif, *.shp, *.xml
Data service system <http://www.sciencedb.cn/dataSet/handle/711>
Sources of funding Major Science and Technology Program of Hainan Province (ZDKJ2016021); Natural Science Foundation of Hainan Province (20164177).
Dataset composition The dataset consists of 2 compressed packages, each of which is named after respective product name: (1) Classification_of_Hainan_Island_Land_cover.zip.zip stores data on the classification of Hainan land cover, with a data volume of about 1.20 GB; (2) Classification_of_Hainan_Island_Natural_Forest.zip stores data on the classification of Hainan natural forest, with a data volume of about 15.5 MB.


引 言

編輯

森林是全球生態系統的重要組成部分,也是國家可持續發展的重要物質基礎和人類社會賴以生存的寶貴資源,隨着人類活動的破壞及全球氣候的變化,使得森林資源遭到了不同程度的破壞,並且面臨着越來越多的威脅[1][2]。目前,傳統的森林資源調查手段在森林資源的調查和監測中依然占據着重要地位。但是隨着遙感技術的進步,利用其對森林資源進行調查正逐漸成為林業調查的一種重要技術手段。相比於傳統林業調查,遙感技術可以快速、宏觀、準確地完成對森林地區信息的收集,通過遙感圖像的處理、解譯和分析等手段可以對目標區域的森林資源進行定性或者定量的調查。遙感圖像分類是遙感技術在林業領域應用的一個重要內容,針對不同來源、不同形式的遙感圖像進行分類不僅為森林資源調查和監測提供了有力支持,而且在森林製圖、林業規劃、森林火災及病蟲害的監測等方面都發揮着重要作用[3][4]。當前,針對海南島人工林的遙感監測研究已經取得了很大進展[5][6]。從分類精度上看,中尺度的橡膠林遙感識別精度較高,而大尺度的橡膠林分類精度較低,小尺度的油棕櫚、柚木林、桉樹林等遙感分類精度則達90%左右。對於海南島熱帶天然林分類研究而言,當前採用的主要還是野外調查、實地勘測等方法,採用遙感手段對其進行分類和類型識別的研究和探討較少。

對於熱帶地區的氣候來說,多雲多雨是影響光學遙感數據的最主要因素,海南地區亦是如此。而微波遙感由於波長較長,穿透能力強,能夠有效穿透雲霧,減少雲霧對觀測效果的影響,因此微波遙感對於熱帶地區進行遙感森林監測來說是一個有力的補充[7]。光學遙感中,主要利用數據中的紅外、近紅外波段對植被疏密程度的敏感性,以及影像中的色彩、紋理等特徵來進行森林資源的調查和監測。而微波遙感中,利用短波段(C波段和X波段)對於森林頂部冠層中不同葉片形狀的後向散射特性的不同來進行識別。利用光學遙感數據和微波遙感數據結合,利用兩者的優勢開展熱帶森林資源的調查和監測正逐漸發展成為一種趨勢。在熱帶森林多雲多雨的氣候條件下,選擇合適的遙感數據源,並利用野外實地採集數據以及其他林業調查資料,研究適用於我國熱帶地區森林分類的方法,使其更好地服務於當地林業部門森林資源調查、林業規劃以及合理開發,是當前的研究熱點之一。

海南島熱帶森林主要分布於中部的山區,主要有尖峰嶺、霸王嶺、黎母山、五指山和吊羅山5大熱帶森林分布區。其中尖峰嶺是海南島面積最大的熱帶森林分布區,由於地形和氣候影響,尖峰嶺熱帶森林類型豐富,植被種類繁多,具有垂直分布結構,植被類型的優勢種並不明顯。尖峰嶺地區主要森林類型有典型熱帶雨林、熱帶季雨林、常綠苔蘚林以及常綠落葉闊葉混交林。尖峰嶺地區的植被種類多達2800多種,主要植被科目有芸香科、蝶形花科、菊科、喬本科、桑科、樟科、龍腦香科、棕櫚科、桃金娘科、杜英科以及灰木科等。其他4個主要的森林分布區由於地勢、氣候以及土壤類型等因素的影響,造成了森林類型分布的一些差異,但總體上的森林類型以及植被種類分布情況基本相似。

因此,本數據集以海南島為研究區,利用光學遙感數據和多時相SAR數據提取海南島天然林主要林型的空間分布。本文研究可以為其他地區的熱帶天然林分類研究提供一定的參考,同時也為海南島天然林的保護和規劃提供決策支持和依據。

1 數據採集和處理方法

編輯

1.1 數據源

編輯

1.1.1 遙感數據

編輯

考慮到數據分辨率的可分性與大區域應用的經濟適用性之間的協同問題,本研究選取中高空間分辨率的遙感數據作為數據源,包括Landsat-8衛星的OLI數據和Sentinel-1A衛星提供的干涉寬幅地距多視產品(IW-GRD),既保證了能有效提取熱帶森林中的天然林類型,也節約了數據收集的成本。採用的投影均為基於WGS84的UTM投影。具體情況如下:2015年11月至2016年2月期間的Landsat-8衛星OLI數據共4景(雲量較少,獲取時間相近),2015年6月至2016年4月期間的Sentinel-1A衛星SAR數據10期共計20景數據(成像模式為干涉寬幅地距多視產品,GRD)。數據詳細信息見下表1。


表1 光學遙感與SAR數據參數

參數 SAR數據 光學數據
衛星 Sentinel-1A Landsat-8
獲取時間 2015/6-2016/4 2015/11-2016/2
極化方式 VV/VH
幅寬/km 250 185
空間分辨率/m 5\(×\)20 30\(×\)30
重訪周期/d 12 16


1.1.2 森林調查數據

編輯

除遙感數據外,為了保證研究工作的準確性和可靠性,還在海南島進行了林業調查,得到了天然林類型採樣數據集。在海南島熱帶森林野外數據採集中,針對海南島熱帶森林典型熱帶雨林、熱帶季雨林、常綠苔蘚林、常綠落葉闊葉混交林等天然林類型和橡膠林、桉樹林、檳榔等人工林類型進行實地數據採集。數據採集實驗主要測量參數有:森林類型、地理坐標和森林類型特徵(森林冠層特徵、代表性樹種)。

野外數據採集在考慮到樣本典型性以及採樣地點可達性行原則的基礎上,選取了儋州、屯昌、樂東附近的人工林分布密集區,以及尖峰嶺、百花嶺、東寨港等天然林分布較為典型的區域。其中,人工林種植區多分布於人類活動易干擾區,為便於樣本快速採集,人工林樣本點基本沿國道或鄉村道路採集;天然林多分布於山區,車輛不易通行,需要徒步進入採集,因此採樣區域有限,此次天然林樣本點採集主要集中在尖峰嶺、百花嶺等地區。本次數據採集樣點分布及樣本信息如圖1所示。


圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖1 野外數據採集樣本實例天然林:A典型熱帶雨林 B常綠落葉闊葉混交林 C熱帶季雨林 D常綠針葉林 E常綠苔蘚林。人工林:F橡膠林 G桉樹林 H木麻黃


野外實地數據共包含了300個樣本點,數據採集後根據數據記錄對採集的森林樣本進行總結,海南島熱帶森林類型具體特徵如下。

(1)人工林:主要分布在海拔較低的平原和丘陵地區,基本為大面積連續的單一樹種,種植分布具有明顯的規律,絕大多數為經濟林種植區。

(2)典型熱帶雨林:植被茂盛,樹種類型豐富,基本沒有受到人為影響,空間結構分層比較明顯,一般分層達到5–7層,主要為草本層、灌木層、幼小喬木層、一般喬木層以及高大喬木層。

(3)常綠落葉闊葉混交林:遭受到的人為影響很大,喜陽植物較多、分層不明顯,一般只有1–2層,主要為灌木層和喬木層。其中落葉樹種主要為楹樹、楓香、海南菜豆樹等。

(4)熱帶季雨林:受到一定的人為影響,分層一般有3–4層,有一定的季相變化,其中變化樹種主要為蒲桃、榕樹等。

(5)常綠針葉林:葉片形狀為針形,樹種主要為加勒比松、南亞松等松樹,分布單塊面積較小且零星分散,基本沒有大面積連續的針葉林樹種。

(6)常綠苔蘚林:主要分布海拔1200 m以上的山頂,樹木矮小,整個冠層高度較矮,且分布面積很小。

1.2 數據處理方法

編輯

由於光學遙感和微波遙感成像機理不同,影響影像數據質量的因素也不同。所以本研究將數據預處理分成2個部分:SAR數據預處理和光學遙感數據預處理。SAR數據預處理包括雷達輻射定標、圖像濾波和地形輻射校正;Landsat-8衛星的OLI數據預處理包括輻射定標和大氣校正。在完成數據預處理後,考慮到不同空間分辨率數據的圖像配准問題,將SAR數據重採樣到Landsat-8多光譜數據一樣的30 m空間分辨率。在此基礎上再進行分類特徵提取,並利用支持向量機(Support Vector Machine,SVM)分類算法對天然林進行提取和分類,並結合野外實地採集數據以及林業調查資料,對天然林分類的精度進行分析,得到海南島天然林分類圖。具體流程如圖2所示。


圖片

圖2 海南天然林分類流程圖


1.2.1 分類特徵提取

編輯

在進行分類特徵選取時,除了要考慮分類地物的典型光譜特徵外,還要考慮波段提供的信息量以及不同波段在分類中作用的重複程度[8][9]。本研究分別對OLI數據的單波段光譜特徵、多波段光譜特徵以及SAR數據的VV、VH極化後向散射係數進行統計分析,提取適合分類特徵。

(1)光譜特徵選取

經過對Landsat-8衛星數據的單波段統計特徵和多波段統計特徵的分析得知:

1)中近紅外波段(Band5)的標準差最大,2個短波紅外波段(Band6和Band7)的標準差同樣較大,藍光波段(Band4)標準差最小(表2)。說明藍光波段能夠反映的地表遙感信息較少,近紅外或短波紅外包含的信息量更多;


表2 Landsat-8衛星OLI數據各波段統計特徵

統計特徵 Band1 Band2 Band3 Band4 Band5 Band6 Band7
最小值 -3099 0 -914 -545 0 -42 -26
最大值 5 676 5 220 5 349 5 404 6 829 8 704 12 862
均值 353.54 309.56 404.78 313.52 1949.68 1155.86 616.20
標準差 468.39 323.82 415.78 394.33 1847.69 1124.38 664.83
亮度差 8 775 5 220 6 263 5 949 6 829 8 746 12 888


2)近紅外波段和前4個波段之間的協方差最大(表3),表明深藍波段、藍光波段、短波紅外2波段與其他波段之間的同向性比較弱;


表3 Landsat-8衛星OLI數據各波段間的協方差

波段 Band1 Band2 Band3 Band4 Band5 Band6 Band7
Band1 219 394.5
Band2 121 423.7 104 865.7
Band3 155 728.8 133 642.0 172 876.5
Band4 138 853.3 121 917.0 156 226.3 155 503.6
Band5 602 995.6 500 286.5 663 677.9 499 214.8 3 413 971.7
Band6 410 048.2 338 228.0 442 356.0 371 290.5 1 969 113.5 1 264 235.0
Band7 247 885.7 206 489.8 267 330.9 244 302.7 1 034 735.6 719 112.9 442 006.2


3)通過表4各個波段的相關係數,可以看出藍光波段、短波紅外2波段與其他波段相關性更強,其獨立性相對較弱。


表4 Landsat-8衛星OLI數據各波段間的相關係數

波段 Band1 Band2 Band3 Band4 Band5 Band6 Band7
Band1 1.000
Band2 0.801 1.000
Band3 0.799 0.992 1.000
Band4 0.751 0.954 0.952 1.000
Band5 0.696 0.836 0.863 0.685 1.000
Band6 0.778 0.928 0.946 0.837 0.947 1.000
Band7 0.796 0.959 0.967 0.931 0.842 0.961 1.000


由於深藍波段比較適合海岸帶觀測,本研究又要對海岸林進行觀測,所以深藍波段也是分類需要考慮的波段。最終將Landsat-8衛星數據中除藍光波段和短波紅外2波段的其他波段作為優選波段,進行分類。

(2)SAR後向散射強度特徵選取

通過對多時期雙極化方式的SAR數據進行統計特徵的分析(表5和表6),可以知道:

1)從6月份到10月份的雨季到11月至來年2月份的旱季標準差整體趨勢是增加的,從側面說明在旱季對地表進行的探測,往往比雨季得到的地表信息更豐富;

2)VH極化SAR數據的標準差普遍高於VV極化的,說明交叉極化模式的SAR數據在進行觀測時,比同極化SAR數據得到的信息更多;

3)2種極化SAR數據都是在2月份達到標準差最大值,說明如果考慮分類數據量的大小,只選擇一期SAR數據進行分類時優先考慮,即在旱季成像的SAR數據。


表5 多時期VH極化後向散射係數統計特徵

統計特徵 最小值 最大值 均值 標準差 亮度差
2015年6月25日 −80.20 24.03 −8.24 7.27 104.23
2015年7月7日 −93.24 17.29 −8.42 7.38 110.54
2015年8月12日 −79.13 22.99 −8.25 7.33 102.12
2015年9月29日 −83.78 23.06 −8.45 7.48 106.84
2015年10月23日 −76.19 19.06 −8.42 7.40 95.25
2015年11月4日 −80.10 21.22 −8.59 7.68 101.32
2016年1月3日 −68.75 17.82 −8.71 7.64 86.57
2016年2月8日 −83.18 19.34 −8.83 7.74 102.52
2016年4月20日 −92.15 21.11 −8.81 7.72 113.26
2016年5月14日 −111.51 21.85 −8.56 7.53 133.36


表6 多時期VV極化後向散射係數統計特徵

統計特徵 最小值 最大值 均值 標準差 亮度差
2015年6月25日 −74.45 36.62 −4.49 4.46 111.07
2015年7月7日 −71.87 28.79 −4.73 4.58 100.67
2015年8月12日 −71.60 37.12 −4.39 4.46 108.72
2015年9月29日 −75.76 37.26 −4.52 4.55 113.02
2015年10月23日 −68.69 31.48 −4.56 4.53 100.17
2015年11月4日 −73.81 36.35 −4.57 4.68 110.17
2016年1月3日 −64.99 27.25 −5.27 5.05 92.24
2016年2月8日 −75.50 32.40 −5.20 4.92 107.90
2016年4月20日 −85.88 33.87 −5.31 5.00 119.75
2016年5月14日 −76.37 31.26 −5.03 4.80 107.623


經過光學數據和SAR數據的統計特徵分析後,綜合考慮數據量大小,波段的有效性和季相變化等因素,最終發現 OLI數據的1、3、4、5、6波段,歸一化植被指數以及2015年8月12日和2016年2月8日的雙極化SAR數據是下一步分類研究需要優先考慮的分類數據組合。

1.2.2 分類算法選擇

編輯

本研究基於SVM算法進行天然林範圍提取和天然林分類。SVM的基礎是統計學習理論的VC維理論和結構風險最小化原理,主要是利用有限的樣本所提供的信息對模型的學習能力和複雜性進行最優的選擇,以便得到最好的泛化能力[10]。SVM的基本原理是將訓練樣本數據通過一定的變換,映射到高維特徵空間,並在高維特徵空間內尋找平面即最優超平面,然後利用該平面使得不同類別的數據區分開來[11]。SVM模型遙感領域中得到了較為廣泛的應用。

本研究中的SVM分類主要是通過ENVI軟件中的支持向量機模塊進行的,其中對於SVM分類建模中主要涉及的參數有核函數選擇和最優參數選擇。在ENVI支持向量機分類模塊中包含的主要核函數有線性核函數(Linear)、多項式核函數(Polynomial)、Sigmoid核函數和高斯徑向基核函數(Radial Basic Function, RBF)。

以上幾種核函數中,使用最為普遍的是RBF核函數。該核函數具有較好學習能力,是一種採用較多,且分類結果較為理想的分類核函數[12]。因此本研究分別選擇RBF核函數進行建模,在ENVI軟件中的SVM模塊中需要選擇分類器參數,經過多次試驗最終確定SVM分類參數。提取天然林範圍時,SVM的參數設置是RBF核函數的γ值為0.083,懲罰係數為100;但是在進行天然林分類時,SVM的參數設置為RBF核函數的γ值為0.077,懲罰係數為100。

1.2.3 海南熱帶天然林分類體系

編輯

由於海南島熱帶天然林分布十分複雜,為避免其他地物類型對天然林分類的影響,本研究的分類方法採用分層分類的策略,首先對天然林範圍進行提取,然後在天然林範圍提取的基礎上對其內部林型進行分類。

(1)海南島土地初級分類體系

對於海南島土地進行初級分類主要目的是對天然林的範圍進行提取,因此只進行基本地物分類。參照遙感數據情況、海南島的實際情況以及初級分類的用途,制定了海南島土地初級分類體系。同時,對於初級分類中的地物類型,通過對Landsat-8衛星遙感影像進行解譯,同時參考了野外實地採樣數據,建立了影像解譯標誌。表7為海南島土地初級分類體系及解譯標誌。圖3為主要地物類型的解譯標誌示意圖。


表7 海南島土地初級分類體系及解譯標誌

一級地類 二級地類 解譯標誌
森林 海岸林 暗綠色,位置在海邊,中間有暗紋
人工林 深綠色,大多數有規則的紋理特徵
天然林 深綠色偏亮,無規則紋理特徵
非森林 人工地表 亮灰色,有些為藍色
水體 深青色,有的水體會偏綠色
裸地 棕黃色,有些具有比較規則的紋理
其他植被 淺綠色或者亮綠色,形狀比較規則


本研究利用這些遙感影像解譯標誌,進行了樣本的選取和訓練,為接下來利用SVM分類模型進行海南島初級分類奠定了基礎。


圖片(a)

圖片(b)

圖片(c)

圖片

圖片(d)

圖片(e)

圖片(f)

圖片(g)

圖3 海南島土地初級分類解譯標誌示意圖(a)海岸林 (b)人工林 (c)天然林 (d)人工地表 (e)水體 (f)裸地 (g)其他植被


(2)海南熱帶天然林分類體系

海南島地處熱帶,是我國熱帶森林植被的重要分布區,特別是海南島中南部地區被普遍認為是具有國際意義的包括植被多樣性在內的生物多樣性最豐富的區域之一。對於海南島熱帶森林的分類體系還存在一定的分歧。在國家2010年發布的森林資源規劃設計調查技術規程[13]中,將森林類別按照用途或樹種進行劃分,樹種類別較多,遙感解譯尚存在較大困難。宋永昌[14]在2011年提出的植被分類系統中,森林被劃分為一個獨立的植被型綱,這樣的劃分更有利於森林系統性的識別。因此,在宋永昌分類系統的基礎上,利用所選取的多源遙感數據,選擇海南島常見林型進行天然林內部類型的分類研究。

本研究在宋永昌2011年提出的植被分類系統(表8)的基礎上[15][14],結合海南島野外調查的實際經驗和遙感機理的分析,將海南島熱帶天然林分為典型熱帶雨林、熱帶季雨林、針葉林、海岸林以及常綠闊葉林。由於海南地區的常綠落葉林只是零散的分布於常綠闊葉林之中,兩者之間並沒有明顯的區別,所以在這裡將常綠闊葉林和常綠落葉闊葉混交林分成一類,統一歸類為常綠闊葉林。


表8 宋永昌提出的森林分類系統

植被型綱 植被型亞綱 植被型組 植被型
森林 Ⅰ. 針葉林 1. 常綠針葉林 1)熱性常綠針葉林
Ⅱ. 闊葉林 2. 常綠落葉闊葉混交林 2)次生常綠落葉闊葉混交林
3. 常綠苔蘚林 3)山地常綠苔蘚林
4. 常綠闊葉林 4)典型常綠闊葉林
5)季節(季風)常綠闊葉林
5. 熱帶季雨林 6)熱帶落葉季雨林
7)熱帶半落葉季雨林
6. 熱帶雨林 8)熱帶(典型)雨林
9)熱帶季節性雨林
7. 海岸林 10)紅樹林
11)熱帶珊瑚礁海岸林
Ⅲ. 竹林與竹叢 8. 竹林 12)叢生竹林
13)混生竹林


2 數據樣本描述

編輯

2.1 海南島土地初級分類

編輯

首先利用SVM分類算法進行海南島的土地初級分類,參照制定的土地初級分類體系,將海南島分為水體、其他植被、人工林、天然林、人工地表、裸地以及海岸林7種地類。海南島土地初級分類結果顯示如圖4所示。


圖片

圖4 基於SVM的海南島土地初級分類結果


2.2 海南島天然林範圍

編輯

在海南島土地初級分類的基礎上,基於SVM方法對海南島土地初級分類中天然林的範圍進行提取。並以此為基礎,依據野外實地調查數據、海南林業部門提供的森林抽樣統計調查數據以及對高空間分辨率影像的目視解譯,對SVM分類結果中的天然林零碎圖斑進行識別,剔除非天然林斑塊,最終得到天然林的總體範圍(圖5)。


圖片

圖5 海南島天然林範圍(紅色區域)


2.3 基於SVM的天然林分類結果

編輯

為了避免其他地類信息干擾天然林分類,本研究在進行天然林範圍提取後,對分類所用的遙感數據進行了裁剪,使得在天然林範圍內只包含天然林林型,沒有其他地類。由於各種天然林林型在遙感影像上的區別較小,僅憑肉眼很難識別。因此,對於天然林分類的樣本選取主要依靠野外實地採樣點和海南林業部門提供的森林抽樣調查資料進行選擇。結合2種資料最終選取了各類天然林樣本280塊,隨機抽取70%進行樣本的訓練和分類,其餘30%用於精度驗證。

同時,本研究利用ENVI軟件中提供的計算ROI可分離性(Separability)工具來確定2個類別間的差異程度。類別間的差異主要通過計算Jeffries-Matusita距離和轉換分離度(Transformed Divergence)來確定任意類別間的統計距離,從而衡量訓練樣本(ROI)的可分離性。表9為海南島天然林類型樣本可分離性統計。


表9 海南島天然林類型樣本可分離性統計

可分離性 典型熱帶雨林 熱帶季雨林 常綠針葉林 常綠闊葉林 海岸林
典型熱帶雨林
熱帶季雨林 1.936 5
常綠針葉林 1.922 0 1.915 7
常綠闊葉林 1.923 6 1.929 1 1.904 8
海岸林 1.984 6 1.986 9 1.934 5 1.978 0


訓練樣本的可分離性值在0–2.0之間,大於1.9說明樣本之間可分離性好,屬於合格樣本;小於1.8,需要編輯樣本或者重新選擇樣本;小於1,考慮將2類樣本合成一類樣本。從表9中可以看出任意天然林類型之間的可分離性均大於1.9,證明了5種天然林類型在此類遙感特徵中的可分離性較好。

基於SVM模型的分類結果如圖6和圖7所示。其中圖7中有一條黃色線狀條帶,這是因為原始Sentinel-1A極化SAR數據缺失導致,在拼接過程中線狀條帶為數據缺失部分。


圖片

圖6 基於SVM的天然林分類結果


圖片

圖7 基於SVM的天然林分類結果細部圖(尖峰嶺)


3 數據質量控制和評估

編輯

3.1 海南島土地初級分類精度分析

編輯

本研究分類結果評價均採用混淆矩陣作為分類精度的評價方法。對於精度評價的指標主要利用了生產者精度、用戶精度、總體精度以及Kappa係數4個精度評價指標[16]。表10為海南島土地初級分類精度評價。


表10 基於SVM的海南島土地初級分類精度評價

真實數據
分類數據 基本地類 水體 天然林 裸地 人工林 人工地表 海岸林 其他植被 總計 用戶精度
水體 2 498 17 0 0 2 2 0 2 519 99.17%
天然林 1 4 525 1 393 0 85 0 5 005 90.41%
裸地 1 0 2 487 0 6 0 0 2 494 99.72%
人工林 0 279 0 3 611 0 17 3 3 910 92.35%
人工地表 0 0 10 0 2 494 0 3 2 507 99.48%
海岸林 0 206 0 3 0 2 396 0 2 605 91.98%
其他植被 0 8 2 2 3 0 2 494 2 609 99.40%
總計 2 500 5 035 2 500 4 009 2 505 2 500 2 500 21 549
生產者精度 99.92% 89.87% 99.48% 90.07% 99.56% 95.84% 99.76%
總體精度:95.15% Kappa係數:0.943


通過利用混淆矩陣對於SVM模型分類結果的精度評價可以看出,基於SVM模型的分類方法在海南土地初級分類中得到了很好的效果,總體精度達到了95.15%,Kappa係數為0.943。

3.2 海南島天然林分類精度分析

編輯

同樣採用混淆矩陣作為天然林分類精度的評價方法,從生產者精度、用戶精度、總體精度以及Kappa係數4個方面進行評價。表11為天然林分類精度評價。


表11 基於SVM的天然林分類精度評價

真實數據
森林地類 典型熱帶雨林 熱帶季雨林 常綠針葉林 常綠闊葉林 海岸林 總計 用戶精度
分類數據 典型熱帶雨林 1389 37 76 207 0 1709 81.28%
熱帶季雨林 108 1354 0 66 0 1528 88.61%
常綠針葉林 0 0 90 0 0 90 100%
常綠闊葉林 0 4 0 1352 0 1356 99.71%
海岸林 3 0 2 0 0 1 080 99.54%
總計 1500 1400 168 1625 1075 5768
生產者精度 92.60% 96.71% 53.37% 83.20% 100%
總體精度:91.19% Kappa係數:0.883 7


通過表11可以看出SVM分類模型在天然林分類中取得了較好的精度。對於天然林分類而言,分類結果的總體精度雖然很高,但是主要由於海岸林等較為容易區分的林型拉升了總體精度,將海岸林等林型排除後,天然林分類中有些林型的分類精度還是比較低,例如常綠針葉林。

對於常綠針葉林而言,基於SVM算法的分類,生產者精度只有53.57%。經過分析,常綠針葉林分類精度不高的原因有2點:(1)在野外實地調查中,可以發現常綠針葉林的分布極為零散,有的甚至以棵的形式存在,即使有成片的常綠針葉林,其面積也很小,根本不足一個像元的面積,這樣就造成了混合像元,在進行樣本的訓練和分類時會造成誤差,從而影響分類精度。(2)本文研究用的是C波段雷達數據,C波段雷達雖然無法穿透茂盛的樹木冠層,但是對於稀疏分布的常綠針葉林來說,則就有一定的穿透性。並且在熱帶天然林中常綠針葉林冠層以下均有闊葉類型的灌木叢分布,這也從一定程度上增加了常綠針葉林和常綠闊葉林的區分難度。因此,利用C波段雷達對於常綠針葉林的葉片形狀並不敏感,這也降低了分類精度。

4 數據價值

編輯

本研究以海南島為研究區域,利用多源遙感數據,進行了多源遙感的數據預處理並對數據特徵進行了分析,在此基礎上對海南島的熱帶天然林進行了提取,並對天然林進行分類研究。利用信息量較大的光學數據波段、旱季雨季的SAR數據和歸一化植被指數組成的數據組合對海南島進行土地初級分類和天然林分類,SVM的總體分類精度分別達到了95%和91.2%,結果表明本文的分類方法在天然林分類中具有很好的效果。天然林的分類結果對進行森林調查和監測具有重要的意義,在生態層面和經濟層面也都有重要的價值。

致 謝

編輯

感謝海南省環境科學研究院協助海南熱帶森林主要參數(森林類型、地理坐標和森林類型特徵)的採集工作,感謝海南林業部門對海南熱帶森林相關輔助數據(森林資源抽樣統計實地調查資料和海南森林植被分布資料)的採集工作。

參考文獻

編輯
  1. 吳楠, 李增元, 廖聲熙, 等. 國內外林業遙感應用研究概況與展望[J]. 世界林業研究, 2017, 30(6): 34-40.
  2. THAPA R B, ITOH T, SHIMADA M, et al. Evaluation of ALOS PALSAR sensitivity for characterizing natural forest cover in wider tropical areas[J]. Remote Sensing of Environment, 2014, 155: 32-41.
  3. 廖凱濤, 齊述華, 王成, 等. 結合GLAS和TM衛星數據的江西省森林高度和生物量製圖[J].遙感技術與應用,2018,33(04): 713-720.
  4. 陳順. Landsat-7ETM+和PALSAR數據聯合反演森林生物量方法研究[D]. 徐州: 中國礦業大學, 2018.
  5. 張京紅, 陶忠良, 劉少軍, 等. 基於TM影像的海南島橡膠種植面積信息提取[J]. 熱帶作物學報, 2010, 31(4): 661-665.
  6. 張京紅, 張明潔, 劉少軍, 等. 風雲三號氣象衛星在海南橡膠林遙感監測中的應用[J]. 熱帶作物學報, 2014, 35(10): 2059-2065.
  7. 周建民, 李震, 李新武. 基於ALOS/PALSAR雷達干涉數據的中國西部山谷冰川冰流運動規律研究[J]. 測繪學報, 2009, 38(4): 341-347.
  8. 柏延臣, 王勁峰. 基於特徵統計可分性的遙感數據專題分類尺度效應分析[J]. 遙感技術與應用, 2004, 19(6): 443-449.
  9. 賈坤, 李強子. 農作物遙感分類特徵變量選擇研究現狀與展望[J]. 資源科學, 2013, 35(12): 2507-2516.
  10. 鄭恩輝. 基於支持向量機的代價敏感數據挖掘研究與應用[D]. 杭州: 浙江大學, 2006.
  11. 王麗艷. 基於視覺詞包算法的SAR圖像分類方法及應用研究[D]. 北京: 中國科學院大學, 2015.
  12. 崔東文, 郭榮. 基於幾種參數優化的支持向量機在徑流預報中的比較分析[J]. 水資源研究, 2013, 34(2): 34-38.
  13. GB/T 26424—2010, 森林資源規劃設計調查技術規程[S]. 北京: 國家林業局調查規劃設計院, 2011.
  14. ^ 14.0 14.1 宋永昌. 對中國植被分類系統的認知和建議[J]. 植物生態學報, 2011, 35 (08): 882-892.
  15. 宋永昌, 閻恩榮, 宋坤. 中國常綠闊葉林8大動態監測樣地植被的綜合比較[J]. 生物多樣性, 2015, 23 (02): 139-148.
  16. 楊冉冉. 基於ALOS數據的遙感森林分類研究[D]. 北京: 首都師範大學, 2013.

數據引用格式

編輯

史建康, 宮晨, 李新武, 等. 基於多源遙感數據的海南島天然林分類數據集[DB/OL]. Science Data Bank, 2018. (2018-12-14). DOI: 10.11922/sciencedb.711.


 

本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse