2010年中國工業產值公里格網數據集

2010年中國工業產值公里格網數據集
作者:薛倩 宋偉 朱會義
2018年6月5日
本作品收錄於《中國科學數據
薛倩, 宋偉, 朱會義. 2010年中國工業產值公里格網數據集[J/OL]. 中國科學數據, 2018, 3(2). (2018-06-05). DOI: 10.11922/csdata.2017.14.zh.


摘要&關鍵詞

編輯

摘要:空間化工業產值數據的缺乏,使得全球變化背景下工業經濟系統風險與災害評估等工作受到很大限制。我們發展了一套融合美國**氣象衛星計劃/線性掃描業務系統(DMSP/OLS,Defense meteorological satellite program/operational linescan system)夜間燈光數據、中分辨率成像光譜儀(MODIS,Moderate resolution imaging spectroradiometer)全年植被數據集、工業用地空間分布數據、城市化率數據的工業產值數據空間化方法,形成了2010年中國工業產值公里格網數據集。本數據集的主要構建步驟為:(1)數據預處理與穩定燈光數據選取;(2)構建基於增強型植被指數的夜間燈光調整指數(EANTLI,Enhanced vegetation index adjusted nighttime light index);(3)利用工業用地空間分布數據獲取工業用地最佳燈光指數;(4)構建工業產值空間分配模型;(5)數據質量精度驗證。全國105個城市的隨機樣本驗證結果表明,空間化工業產值數據的相對誤差在0%~39.6%之間,且大部分樣本的相對誤差小於15%,數據集平均精度為81.40%。本數據集解決了二三產業產值空間化數據難以區分的問題,空間化數據打破了行政邊界的限制,可以直觀地反映出工業產值在時空數量差異以及分布特徵,對於劃分中國工業重點區域劃分、釐清工業產業變化趨勢等有重要價值。

關鍵詞:工業產值;中國;DMSP/OLS;空間化

Abstract & Keywords

編輯

Abstract: The lack of spatial industrial output value data limited the risk and disaster assessment of industrial economy responding to global change. Therefore, we developed a new method to spatialize industrial output value coupling DMSP/OLS (Defense meteorological satellite program/operational linescan system) nighttime light data, MODIS (Moderate-resolution imaging spectroradiometer) annual vegetation data, industrial land distribution data and urbanization rate. A grid data set of 1 km industrial output value of China was created using this method. The main steps creating the data set were as follows: (1) data preprocessing and selecting stable lighting data; (2) constructing an Enhanced Vegetation Index (EVI) adjusted nighttime light index (EANTLI); (3) obtaining optimum light index by industrial land distribution data; (4) constructing spatial distribution model of industrial output value; (5) verifying data accuracy. We randomly selected 105 cities nationwide to assess the accuracy of the data set. The results show that the relative errors of whole samples ranged from 0% to 39.6%,the relative errors of most samples were less than 15%, and the average accuracy of the data set was as high as 81.40%. The dataset solved the problem that the industrial output value and service output value are difficult to be distinguished in value spatialization. The dataset broke the limits of administrative boundaries so as to directly reflect the spatialandtemporaldisparities and distribution features of industrial output value. The advances of the dataset could contribute to the identification of China’s key industrial distribution areas and discern the change trend of industry.

Keywords: industrial output value; China; DMSP/OLS; spatialization

數據庫(集)基本信息簡介

編輯
數據庫(集)名稱 2010年中國工業產值公里格網數據集
數據作者 薛倩、宋偉、朱會義
數據通信作者 宋偉(songw@igsnrr.ac.cn)
數據時間範圍 2010年
地理區域 中國大陸地區
空間分辨率 1000 m
數據量 15.1 MB
數據格式 *.tif ,*.shp, *.mxd, *.xlsx
數據服務系統網址 http://www.sciencedb.cn/dataSet/handle/551
基金項目 國家重點研發計劃,全球變化人口與經濟系統風險形成機制及評估研究(2016YFA0602402)
數據庫(集)組成 數據集由3部分數據組成,其中:1 2010年中國工業產值公里格網數據集.gdb.zip是包含行政邊界信息以及柵格格式的中國2010年每公里工業產值數據(13.8 MB)。2. 精度驗證.xls是全國90個城市工業產值統計數據和驗證精度說明(23 KB)。3. 2010年中國工業產值公里格網數據集.mxd是可編寫的ArcGIS數據文件(730 KB)。

Dataset Profile

編輯
Title 1 km industrial output value grid data set of China(2010)
Data author(s) Xue Qian, Song Wei, Zhu Huiyi
Data corresponding author Song Wei (songw@igsnrr.ac.cn)
Time range 2010
Geographical scope Mainland China
Spatial resolution 1000 m
Data volume 15.1 MB
Data format *.tif ,*.shp, *.mxd, *.xlsx
Data service system http://www.sciencedb.cn/dataSet/handle/551
Source(s) of funding National Key Research and Development Program--Global Change and Mitigation Project: Global change risk of population and economic system mechanism and assessment (2016YFA0602402)
Dataset/Database composition The dataset is composed of three subsets. (1) 1 km industrial output value grid data set of China(2010).gab.zip includes administrative border data and spatial distribution data of industrial output value of mainland China in 2010. The format of the spatial distribution data is 1 km grid with a data volume of 13.8 MB. (2) Accuracy verification.xls is an accuracy file including the randomly selected 90 sample cities for accuracy assessment in China and their statistical industrial output value, spatialized value and assessed accuracy. The data volume is 23 kB. (3) 1 km industrial output value grid data set of China(2010). mxd is a programmable ArcGIS data file, with a data volume of 730 KB.


引 言

編輯

辨析氣候變化下的社會經濟系統風險是目前氣候變化研究的重點內容之一[1]。就工業系統而言,氣候變化一方面通過均值波動間接對工業行業的原料存儲、加工以及運輸過程產生影響[2],另一方面通過極端氣候事件對工業生產的各個環節及工作人員產生破壞性的影響(例如工廠基礎設施破壞、人員傷亡等)[3][4]。準確評估氣候變化帶來的工業經濟系統風險與損失,依賴於較高精度的工業經濟系統暴露分析[5],工業產值的空間分布製圖則是工業經濟系統暴露分析的重要基礎數據之一。

近年來,國內外在國內生產總值(GDP,Gross domestic product)空間分布製圖方面已經取得了比較多的進展[6]。但是,由於常規的遙感手段很難在空間上實現第二、三產業產值的準確識別,全球以及中國工業產值格網數據仍然相對缺乏。目前,已有的一些工業經濟系統產值數據空間化製圖,多為省、市、縣級尺度[7],且空間分辨率多以行政區為最小單元,無法表徵省或者城市內部工業產值的差異及空間分布,在風險評估中很難與氣候格網數據等開展疊加分析;基於此,也有一些針對工業某一具體行業產值的空間化研究數據[8][9],但是總體上缺少大尺度(中國)、高分辨率、綜合性的工業產值空間化數據。所以,本數據集結合DMSP/OLS夜間燈光數據、中國各省工業產值統計數據以及MODIS中的植被指數產品,對中國2010年工業產值進行遙感反演,並利用工業用地空間分布數據對其進行修正,形成中國1 km分辨率的工業產值格網數據集。本數據集可以為全球變化中工業經濟系統的風險與災害評估等提供基礎數據支撐。

1 數據採集和處理方法

編輯

本數據集構建過程包括數據收集、夜間燈光數據和植被指數數據預處理、構建基於增強型植被指數的夜間燈光調整指數(EANTLI)及利用工業用地空間分布數據進行燈光修正、構建分配模型、數據質量精度驗證幾個步驟(圖1)。


圖片

圖1 數據集構建及處理流程


1.1 數據來源

編輯

本數據集對工業的定義以世界銀行數據統計標準為主,包含採礦、製造、建築、電力、水和天然氣生產和供應業,與中國統計局差別在於將建築業納入了工業。所以,本數據集中所採用的2010年全國各省份工業產值和市級工業產值數據為工業產值和建築業產值之和。數據均來自於國家統計局發布的《中國統計年鑑》和各省統計年鑑(http://www.stats.gov.cn/tjsj/ndsj/)。

夜間燈光數據選取美國氣象衛星DMSP/OLS成像得到的非輻射定標夜間平均燈光產品。其優勢在於能通過燈光強度變化反應地理實體信息,特別地,該產品中的穩定燈光數據通常被用於提取城市區域[10][11]、反演社會經濟數據[12][13]等研究中。本數據集所選取的夜間燈光數據為穩定燈光數據(https://ngdc.noaa.gov),其空间分辨率为1 km,像元灰度值(DN,Digital number)範圍為0~63,數據時間為2010年。由於DMSP/OLS數據存在的飽和與溢出現象會削弱燈光數據和社會經濟數據的相關性[14],並影響反演精度。而且有研究表明,植被指數和燈光強度值變化存在較好相關關係[15],因此可以通過植被指數來消除夜間燈光數據的飽和與溢出現象對社會經濟數據反演的影響。所以本數據集選取空間分辨率為1 km的MODIS月合成植被指數產品(MOD13A3)中的增強型植被指數(EVI,Enhanced vegetation index)(http://ladsweb.nascom.nasa.gov/data)对灯光饱和与溢出现象进行预处理。

此外,選取中國科學院資源環境科學數據中心2010年工業用地空間分布數據(http://www.resdc.cn)对EANTLI指数进行精度修正。

1.2 數據處理

編輯

利用夜間燈光數據與植被指數之間關係消除燈光數據飽和與溢出現象,並構建最佳燈光指數,同時利用工業用地空間分布數據對其進行修正,得到工業用地上的最佳燈光數據,並與工業產值數據構建分配模型。此外,針對西部地區工業產值較低且工業用地分布較為離散造成的較大低估現象問題,利用城市化率對新疆、西藏等四個燈光值較弱的省份進行修正,最終形成2010年中國工業產值公里格網數據集。具體流程如下:

(1)對夜間燈光數據進行預處理,包括按行政邊界剪裁、二值化、歸一化等,提取燈光強度值,並計算歸一化的燈光強度值;

(2)對MODIS植被指數數據進行處理,從MOD13A3產品中提取出中國2010年1–12月的EVI,然後進行初步的剪裁、鑲嵌、投影等工作;

(3)EVI數據處理,計算EVI的均值,為去除月份不同對夜光數據造成的敏感性,所以本數據集選取EVI全年12個月的均值數據,並剔除EVI小於0.01的區域,此區域包括水體、裸岩等無人區域;

(4)構建最佳燈光指數,其計算公式如式(1)[14]

圖片 (1)

其中,EANTLI為最佳燈光指數,NTLn 為歸一化燈光強度,EVIi 指處理過後的EVI數據,NTL為原始燈光強度。

EANTLI能夠較大程度上削減燈光飽和與溢出現象,以凸顯城市內部燈光強度差異,更好地對經濟數據進行反演。

(5)通過工業用地空間分布數據對第4步得到的EANTLI指數結果進行修正,本數據集認為僅工業用地上存在工業產值,通過工業用地數據對EANTLI指數進行工業工地上的燈光值提取,得到工業用地最佳燈光指數EI。

(6)利用國家統計局《中國統計年鑑[16]中計算得到的全國各省2010年工業產值數據與工業用地最佳燈光指數進行回歸分析,構建分配模型:

圖片 (2)

其中,I代表每個柵格上的工業產值,Ii 代表每個各省的工業產值,EIi 代表每個省的工業用地最佳燈光指數。

經過該步驟,初步獲得到工業產值公里格網數據。

(7)通過對第6步獲得的數據驗證發現,由於新疆、青海、西藏、雲南四個省份的工業產值較低、工業用地較少且分布較為離散,導致存在較大的產值低估現象。針對這個問題,本數據集利用與工業產值在市級尺度上存在顯著相關(0.01置信度水平下)的輔助數據——四個省份的土地城市化率進行構建多元線性回歸模型進行數據修正,模型如下:

圖片 (3)

其中Ig 代表修正後的工業產值,In 代表第(6)步中得到第n個柵格的工業產值,Un 代表第n個柵格的城市化率,a、b分別為In 、Un 的參數,c為常量。

(8)利用市級統計年鑑驗證各城市工業產值數據精度,滿足則得到最終2010年中國工業產值公里格網數據集,否則重新構建分配模型。

2 數據樣本描述

編輯

經過數據處理,得到2010年中國工業產值公里格網數據集。本數據集可以比較清晰地反映每公里工業產值的空間分布特徵。由於地理位置及政策優勢,我國工業產值的高值區域主要分布在我國沿海區域,特別是長三角、珠三角、環渤海等幾個典型地區(圖2);而西北地區由於地處內陸,交通運輸條件較差,工業產值普遍較低,且呈點狀零星分布,且相較於沿海區域數值明顯較低。


圖片

圖2 2010年中國工業產值公里格網數據(審圖號:GS(2018)2341號)


3 數據質量控制和評估

編輯

數據驗證時,開展了省級工業用地最佳燈光數據與工業產值的相關性分析,結果顯示兩者顯著相關(在0.01置信度水平下),且相關係數達到0.72。同時,隨機選取了全國105個不同市級行政單位(圖3),利用ArcGIS的統計工具,將工業產值公里格網數據進行統計,並與市級統計年鑑中計算得到的工業產值數據進行對比。整體而言,平均精度達到81.40%(圖4)。為了使數據能夠給其他行業深度分析帶來參考,我們又按照城市主導功能的不同,從105個驗證樣本中挑選了不同產業類型城市進行了精度驗證比較。按照全國資源型城市可持續發展規劃(2013–2020年)的分類標準和相關文獻[17][18],選取了11個資源型城市、10個綜合型城市和17個工業型城市(表1)進行驗證比較,結果表明資源型城市整體平均精度為82.27%,其中7個煤炭型城市平均精度為82.75%,1個有色金屬城市精度為94.08%,3個石油城市平均精度77.22%;總體而言,綜合型城市整體平均精度為82.34%;工業型城市整體平均精度為77.25%。不過,部分西部欠發達區域精度略低,環渤海區域、長三角、珠三角等工業較發達區域工業產值反演精度較高。西部地區精度偏低的主要原因在於經濟發展水平偏低導致區域燈光強度較弱,且內部差異較小,使得反演精度偏低。為了解決這個問題,我們利用與工業產值有較好相關性的城市化率數據對新疆、西藏、青海、雲南四個省份進行了數據校正,校正後精度有較大的提升,提高了12.1個百分點(由62.4%提高到74.5%)。


圖片

圖3 精度驗證選擇的105個樣本城市的位置(審圖號:GS(2018)2341號)


註:橫坐標軸為所選驗證城市的序號,左側縱坐標軸為對應該城市的空間化與統計年鑑工業產值,右側縱坐標軸為該城市的空間化產值數據的驗證精度。


圖片

圖4 數據集中數據與統計年鑑數據對比及精度


表1 分類型城市精度驗證

資源型城市 綜合型城市 工業型城市
城市 精度(%) 城市 精度(%) 城市 精度(%) 城市 精度(%)
煤炭型城市 邢臺 80.34 北京 99.87 揚州 76.99 寧波 65.96
朔州 96.80 上海 100.00 自貢 61.10 柳州 63.88
烏海 68.32 天津 99.99 江門 88.85 淄博 63.88
阜新 94.85 哈爾濱 74.87 新鄉 81.07 台州 62.26
平頂山 71.35 西安 80.67 開封 89.36 包頭 96.14
廣元 94.75 瀋陽 65.33 鹽城 94.96 湖州 80.55
六盤水 72.84 東莞 90.18 南通 74.22
有色金屬城市 葫蘆島 94.08 佛山 86.60 溫州 75.29
石油城市 濮陽 70.71 南昌 65.01 中山 78.52
潛江 71.24 石家莊 60.87 無錫 90.70
克拉瑪依 89.73 洛陽 86.00
平均精度(%) 82.27 82.34 77..5


本數據處理過程在地理信息系統軟件ArcGIS平台下進行,數據處理過程科學合理規範,保證了數據空間分辨率的準確性和可靠性。

4 數據價值

編輯

工業產值公里格網數據打破了行政邊界的限制,通過夜間燈光數據對工業產值數據進行大尺度反演,得到高精度、高分辨率空間化的柵格數據,從而可以直觀地分析工業產值區域間數量差異以及時空分布特徵,為劃分中國工業重點區域、釐清工業產業變化趨勢、評估工業用地效率等提供了數據支撐,特別是為氣候變化下工業產業暴露及脆弱性評估提供了基礎數據,從而為工業布局規劃及極端災害條件下工業產業受災預警及災害評估提供參考。

此外,本數據集中工業定義以世界銀行中工業定義為準,可用於全球尺度的工業產值變化評估研究。特別地,雖然全球或者區域空間化產品較多,但大都是GDP、人口的空間化產品,特別是現有GDP空間化數據集大多是對二三產業合併處理,鮮有單獨的二產或三產空間化數據集產品。本數據集提出的遙感反演、工業用地修正、城市化率修正等方法,能夠有效在空間上區分第二與第三產業產值,豐富了社會經濟數據的空間化方法,為以後的類似研究提供了借鑑。在精度上,本數據集的平均精度達到了81.40%,相較於以往類似研究有了明顯提升。

5 數據使用方法和建議

編輯

本數據集中包含工業產值公里格網文件(.tif)和檢驗數據文件(.xls)以及處理過程數據庫(.gdb),可用ArcGIS軟件對數據進行讀寫,也可用 Python 等主流編程語言調用相關函數庫讀寫,實現數據批處理。

對於全球氣候變化的相關研究工作,1km的全國工業產值數據集可以滿足目前研究的精度。同時,1km也是夜間燈光影像數據、MODIS 植被指數數據、土地利用柵格數據(全國尺度)常用的空間分辨率,這個分辨率能夠最好地匹配製作工業產值所需的空間基礎數據。鑑於製作工業產值空間化反演的基礎數據在空間分辨率均為1km,數據集的分辨率已達到最高。如果後期需要匹配大尺度低分辨的氣象數據(如0.1°,0.25°等),可以藉助於百分比柵格的方法對數據集進行升尺度,這個方法不會影響降低分辨率之後的數據集精度。

此外,在數據集更新方面,我們在此數據集的基礎上會根據基礎數據——土地利用(更新周期:5年)、夜間燈光影像數據(更新周期:1年)、MODIS植被指數數據(更新周期:1年)、統計年鑑數據(更新周期:1年)的更新周期進行數據更新,擬依據更新周期最長的土地利用數據的更新周期(5年)進行數據集更新。同時,對未來工業產值格網格化數據,我們會通過動力降尺度的方法進行多源數據融合模擬,製作未來不同氣候變化情景下的工業產值空間數據。

參考文獻

編輯
  1. IPCC, Working Group I. Climate Change 2013: The Physical Science Basis[J]. Contribution of Working, 2013, 43(22): 866-871.
  2. 王守榮. 氣候變化對中國經濟社會可持續發展的影響與應對[M]. 北京: 科學出版社, 2011.
  3. KEPPENNE C L, GHIL M. Extreme weather events[J]. Nature, 1992, 358(6387): 547.
  4. CRUZ A M, KRAUSMANN E. Vulnerability of the oil and gas sector to climate change and extreme weather events[J]. Climatic Change, 2013, 121(1): 41-53.
  5. LEREBOULLET A, BELTRANDO G, BARDSLEY D. Socio-ecological adaptation to climate change: A comparative case study from the Mediterranean wine industry in France and Australia[J]. Agriculture Ecosystems & Environment, 2013, 164(164): 273-285.
  6. SUTTON P C, COSTANZA R. Global estimates of market and non-market values derived from nighttime satellite imagery, land cover, and ecosystem service valuation[J]. Ecological Economics, 2002, 41(3): 509-527.
  7. 劉永偉, 閆慶武. 基於SLM模型的中國碳排放格網化空間分布模擬[J]. 地理與地理信息科學, 2015, 31(3): 76-80.
  8. DONG L, LIANG H, GAO Z, et al. Spatial distribution of China's renewable energy industry: Regional features and implications for a harmonious development future[J]. Renewable & Sustainable Energy Reviews, 2016, 58(4): 1521-1531.
  9. LIU X L, FANG C L. Wind energy resources distribution and spatial differences of wind power industry in China[C]. Marietta: American Scholars Press, 2007.
  10. CHEN Z, YU B, SONG W, et al. A New Approach for Detecting Urban Centers and Their Spatial Structure With Nighttime Light Remote Sensing[J]. IEEE Transactions on Geoscience & Remote Sensing, 2017, PP(99): 1-15.
  11. HUANG X, SCHNEIDER A, FRIEDL M A. Mapping sub-pixel urban expansion in China using MODIS and DMSP/OLS nighttime lights[J]. Remote Sensing of Environment, 2016, 175: 92-108.
  12. WU J, WANG Z, LI W, et al. Exploring factors affecting the relationship between light consumption and GDP based on DMSP/OLS nighttime satellite imagery[J]. Remote Sensing of Environment, 2013, 134(7): 111-119.
  13. WANG W, CHENG H, ZHANG L. Poverty assessment using DMSP/OLS night-time light satellite imagery at a provincial scale in China[J]. Advances in Space Research, 2012, 49(8): 1253-1264.
  14. ^ 14.0 14.1 ZHUO L, ZHENG J, ZHANG X, et al. An improved method of night-time light saturation reduction based on EVI[C]. AAG, Chicago, USA, 2015.
  15. WANG Z, YAO F, LI W, et al. Saturation Correction for Nighttime Lights Data Based on the Relative NDVI[J]. Remote Sensing, 2017, 9(7): 759-772.
  16. 國家統計局. 中國統計年鑑-2011[M]. 2011.
  17. 許鋒, 周一星. 科學劃分我國城市的職能類型,建立分類指導的擴大內需政策[J]. 城市發展研究, 2010, 17(2): 88-97.
  18. 張文舉, 劉嗣明, 鄭永丹. 國內資源型城市經濟轉型文獻綜述[J]. 資源與產業, 2015, 17(3):22-26.

數據引用格式

編輯

薛倩, 宋偉, 朱會義. 2010年中國工業產值公里格網數據集[DB/OL]. Science Data Bank, 2017. (2017-12-29). DOI: 10.11922/sciencedb.551.


 

本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse