中國鄉鎮(街道)人口密度數據集(2010年)
中國鄉鎮(街道)人口密度數據集(2010年) 作者:王卷樂 王曉潔 王明明 姚錦一 王嵐濤 邱叢叢 2020年4月1日 |
|
摘要&關鍵詞
編輯摘要:鄉鎮(街道)級人口統計數據是中國目前公開的最精細的人口統計數據。將人口統計數據和行政邊界數據進行屬性關聯,實現人口統計數據的空間展布,對於支持地理、資源、環境、生態、災害,以及可持續發展等方面的研究具有重要意義。本數據集將2010年國家統計局發布的中國31個省(直轄市、自治區)的鄉鎮(街道)單元人口統計數據按鄉鎮行政區劃建立空間匹配,經過拓撲處理、屬性匹配、人口密度計算和矢柵轉換,形成2010年鄉鎮(街道)級人口密度數據集,數據集為TIFF柵格形式。
關鍵詞:人口統計學;人口密度;空間分布;鄉鎮級;中國
Abstract & Keywords
編輯Abstract: Township-level demographic data is the most detailed data released in China currently. Associating the attribute table of demographic data with the one of administrative boundary data to realize spatial distribution of population, is significant to the research of geography, resources, environment, ecology, disasters, sustainable development, etc. This dataset establishes spatial matching of administrative divisions to township level demographic data released by National Bureau of Statistics in 2010 covering 31 provinces, municipalities, and autonomous regions in China. Through topology processing, attribute matching, population density calculation and vector grid conversion, the township-level population density dataset of China (2010) was formed in the TIFF format.
Keywords: demography; population density; spatial distribution; township-level; China
數據庫(集)基本信息簡介
編輯數據庫(集)名稱 | 中國鄉鎮(街道)人口密度數據集(2010年) |
數據作者 | 王卷樂、王曉潔、王明明、姚錦一、王嵐濤、邱叢叢 |
數據通信作者 | 王卷樂(wangjl@igsnrr.ac.cn) |
數據時間範圍 | 2010年 |
地理區域 | 安徽省、北京市、福建省、甘肅省、廣東省、廣西省、貴州省、海南省、河北省、河南省、黑龍江省、湖北省、湖南省、吉林省、江蘇省、江西省、遼寧省、內蒙古自治區、寧夏回族自治區、青海省、山東省、山西省、陝西省、上海市、四川省、天津市、西藏自治區、新疆烏魯木齊自治區、雲南省、浙江省、重慶市 |
空間分辨率 | 1 km |
數據量 | 108 MB |
數據格式 | *.tif |
數據服務系統網址 | http://www.sciencedb.cn/dataSet/handle/964 |
基金項目 | 中國科學院戰略性先導科技專項(A類)(XDA19040501),中國科學院「十三五」信息化專項科學大數據工程項目(XXH13505-07) |
數據庫(集)組成 | 數據集共包括1個文件,為:2010中國鄉鎮(街道)人口數據.zip. 其中:(1) 2010中國鄉鎮(街道)人口數據.tif是中國31省平均人口密度的柵格圖像,數據量108 MB;(2) 2010中國鄉鎮(街道)人口數據.tfw存儲空間參考信息,數據量1 KB;(3) 2010中國鄉鎮(街道)人口數據.tif.ovr是金字塔文件,數據量3.1 MB;(4) 2010中國鄉鎮(街道)人口數據.tif.aux.xml存儲其他輔助信息的XML文件,數據量1.4 KB. |
Dataset Profile
編輯Title | China township-level population density dataset (2010) |
Data corresponding author | Wang Juanle (wangjl@igsnrr.ac.cn) |
Data author(s) | Wang Juanle, Wang Xiaojie, Wang Mingming, Yao Jinyi, Wang Lantao, Qiu Congcong |
Time range | 2010 |
Geographical scope | Anhui, Beijing, Fujian, Gansu, Guangdong, Guangxi, Guizhou, Hainan, Hebei, Henan, Heilongjiang, Hubei, Hunan, Jilin, Jiangsu, Jiangxi, Liaoning, Inner Mongolia, Ningxia, Qinghai, Shandong, Shanxi, Shaanxi, Shanghai, Sichuan, Tianjin, Xizang, Xinjiang, Yunnan, Zhejiang, Chongqing |
Spatial resolution | 1 km |
Data volume | 108 MB |
Data format | *.tif |
Data service system | <http://www.sciencedb.cn/dataSet/handle/964> |
Source(s) of funding | Strategic Priority Research Program of Chinese Academy of Sciences (XDA19040501); Specific Informatization Scientific Research Science Program of Chinese Academy of Sciences (XXH13505-07). |
Dataset/Database composition | The dataset consists of 1 subsets in total. The subsets are recorded as China township (street) population data.zip: 1. 2010 China township (street) population data.tif is a raster image of the average population density of 31 provinces in China, with a data volume of 108 MB; 2. 2010 China township (street) population data.tfw storage space reference information, with a data volume of 1KB; 3. 2010 China township (street) population data.tif.ovr is a pyramid file, with a data volume of 3.1 MB; 4. 2010 China township (street) population data.tif.aux.xml storing other auxiliary information of XML file, with a data volume of 1.4 KB. |
引 言
編輯「100億人在地球上如何生存和分布」被認為是21世紀地理科學的11個重大戰略方向之一[1]。空間分布是人口的重要屬性,人口密度則是表現人口空間分布最主要的形式和衡量人口分布地區差異的主要指標[2]。中國擁有世界上最多的國家人口總數,人口分布不平衡,資源環境承載壓力大[3]。準確、精細的人口密度數據能夠為區域規劃與開發、災害風險評估和救援、醫療資源配置和資源環境承載力評估等研究和應用提供支撐[4]。鄉鎮級人口統計數據是目前官方公布的最精細的人口數據,然而鄉鎮級的人口空間數據缺乏。究其原因在於兩點,一是鄉鎮級行政區劃矢量數據獲取困難,且存在大量的行政區劃和地名變更問題,難以直接利用。二是鄉鎮級人口統計數據的空間關聯需要進行大量的涉及鄉鎮地名和行政區劃的空間數據匹配處理工作,工作量大且技術要求較高。本文將2010年國家統計局發布的中國31個省(直轄市、自治區)鄉鎮(街道)單元的人口統計數據按鄉鎮行政區劃建立空間匹配。利用鄉鎮級行政區劃數據的人口屬性和面積屬性計算鄉鎮級平均人口密度,經過矢柵轉化形成本數據集。
1 數據採集和處理方法
編輯1.1 數據採集
編輯統計數據來源於中國國家統計局,鄉鎮(街道)邊界數據來源於國家科技基礎條件平台–地球系統科學數據共享平台。
1.2 處理方法
編輯1.2.1 拓撲錯誤處理
編輯鄉鎮級行政區劃矢量數據易存在兩種拓撲錯誤:行政區劃邊界處存在重疊或空隙現象。造成這種錯誤有兩種情況,一種是由鄉鎮(街道)矢量單元發生偏移造成的有規律的重疊和空隙,另一種是由鄉鎮(街道)矢量單元存在殘缺或多餘造成的不規律的重疊和空隙。其中第一種情況利用ArcGIS軟件的空間校正(Spatial Adjustment)功能將鄉鎮(街道)矢量單元移回原來的位置,第二種情況利用ArcGIS的建立拓撲功能中的「不能重疊(Must Not Overlap)」和「不能有縫隙(Must Not Have Gaps)」規則實現對殘缺部分的補充和對多餘部分的去除。
1.2.2 屬性關聯
編輯鄉鎮級人口統計數據與鄉鎮級行政區劃矢量數據的屬性關聯是指人口統計數據的鄉鎮(街道)單元的人口總值屬性同行政區劃矢量數據的空間屬性相關聯,實現鄉鎮級人口統計值在空間上的分布。鄉鎮級人口統計數據與鄉鎮級行政區劃矢量數據的屬性關聯可以通過兩者的公用字段(鍵)來自動關聯,但往往由於存在以下三種情況導致人口統計數據和行政區劃矢量數據不能完全自動關聯成功:①鄉鎮級行政區劃矢量數據的表徵時間和鄉鎮級人口統計數據的時間不一致,在這段時間差內發生過行政區劃的調整;②鄉鎮級行政區劃矢量數據存在誤差,矢量數據的行政區劃單元多於或少於人口統計數據的行政單元;③人口統計數據和行政區劃矢量數據對鄉鎮(街道)的命名方式不統一。由以上原因造成自動關聯失敗的鄉鎮(街道)單元需要進行手動關聯。
本文採用決策樹的思想實現鄉鎮級人口統計數據與鄉鎮級行政區劃矢量數據的屬性關聯,如圖1所示。此決策樹共包含四層。第一層根節點以鄉鎮(街道)的名稱作為公用字段(鍵)實現矢量數據和統計數據的自動關聯,由此會出現自動關聯部分和不能自動關聯部分兩個有向邊。第二層對這兩部分做進一步處理,其中自動關聯部分需要以區縣為單元檢驗自動關聯的準確性,自動關聯失敗的部分以區縣為單元進行手動關聯,尋找自動關聯失敗的原因,由此產生6個有向邊。第三層包含2個內部節點和4個葉節點。左邊的內部節點是由行政區劃調整導致的自動關聯失敗,需要根據調整信息統一矢量數據和統計數據的行政區劃;右邊的內部節點是自動關聯錯誤的情況下,手動尋找統計數據中對應的人口值,兩個內部節點分別產生兩個有向邊。中間的4個葉節點是第二層中間4個有向邊的具體解決方案。第四層是第三層四個有向邊的具體解決方案。具體流程如圖1所示。[5]
圖1 鄉鎮級人口空間數據庫建設流程[5]
1.2.3 平均人口密度計算
編輯根據公式(1),計算各鄉鎮(街道)平均人口密度:
\(PD=\frac{P}{A}\) (1)
式中,PD為人口密度(人/ km2);P為鄉鎮(街道)人口數量(人);A為鄉鎮(街道)面積(km2)。
1.2.4 矢量轉柵格
編輯利用ArcGIS的Polygon to Raster工具將人口密度矢量圖層轉化為柵格圖層,空間分辨率為1 km×1 km。
2 數據樣本描述
編輯本數據集為柵格數據類型,空間分辨率為1 km2,後綴名為.tif。本數據集包括全國22個省、5個自治區以及4個直轄市內43691個鄉鎮(街道)單元的平均人口密度信息。數據以Krasovsky橢球為基準,投影方式為Albers投影,最後生成中國2010年分鄉鎮街道人口密度分布圖(圖2)。從圖2可以看出,中國31個省市自治區的人口密度由東部地區至西部地區總體上呈現出密集到稀疏的分布規律,人口主要集中分布在中國的中東部地區。藍色區域代表人口平均密度小於等於50人/km2,紅色範圍表示人口平均密度大於等於2000人/km2。
圖2 中國2010年分鄉鎮街道人口密度分布(圖片送審中)
3 數據質量控制和評估
編輯利用省級行政區劃矢量邊界統計柵格數據集,得到每個省份的柵格數據集人口值,與2010年省級人口統計數據進行對比(圖3),其人口分布趨勢與省市級統計人口值基本一致,其中福建省和浙江省人口略偏有出入。計算全國省級統計人口數據與柵格數據集人口數據之間的相對誤差(圖4),各省(市)誤差控制在10%之內,說明該人口數據集精度較高。其誤差計算公式為:
\(E=\left(\frac{{p}_{i1}-{p}_{i2}}{{p}_{i2}}\right)×100,\mathrm{ }\mathrm{ }\left(\mathrm{i}=1,2,3\dots 31\right)\) (2)
其中,E表示相對誤差;\({p}_{i1}\)表示第i個省級行政區柵格數據集的值;\({p}_{i2}\)表示第i個省級行政區統計人口值。
圖3 柵格數據集人口與統計人口對比
圖4 柵格數據集人口與統計人口誤差
4 數據價值
編輯本數據集包括2010年全中國31個省級行政區,其中22個省、5個自治區和4個直轄市鄉鎮街道單元內人口統計數據。本數據集將全國範圍內(不包括港、澳、台特別行政區)鄉鎮街道級人口統計數據與43691個鄉鎮街道界限矢量數據進行關聯,在空間上展示中國最精細的鄉鎮級人口分布數據。中國的全國人口普查數據每10年統計一次,因此本數據集可以成為鄉鎮(街道)級人口數據分布的本底數據集,可以在空間尺度上反映我國人口的精細分布狀況,為經濟發展、城市規劃、醫療資源配置、災害評估等提供數據參考。
5 數據使用方法和建議
編輯中國2010年鄉鎮街道級人口密度數據集可以用ArcGIS、ENVI等地理信息系統相關軟件打開[4]。本數據集的空間分辨率為1 km,可以直接用來表徵中國鄉鎮街道級的人口空間分布,為中國人口、資源、環境、災害、生態等科學研究提供重要基礎和本底數據。同時也可以結合同一尺度的土地利用數據、居民點數據、DEM數據、夜間燈光數據、道路交通數據、社交媒體數據等多源數據進行融合和綜合分析,進一步揭示中國區域人口空間化的地理分布特徵,為人類活動模擬、區域規劃、資源配置、災害評估等研究和應用提供數據產品。
致 謝
編輯感謝中國國家統計局提供的中國第六次人口普查鄉鎮街道級人口統計數據。感謝國家科技基礎條件平台—地球系統科學數據共享平台提供部分鄉鎮界線數據。
參考文獻
編輯- ↑ National Research Council(NRC). 理解正在變化的星球: 地理科學的戰略方向[M]. 劉毅, 劉衛東, 譯. 北京:科學出版社, 2011.
- ↑ 祝卓. 人口地理學[M]. 北京: 中國人民大學出版社, 1991.
- ↑ 葛美玲, 封志明. 基於GIS的中國2000年人口之分布格局研究——兼與胡煥庸1935年之研究對比[J]. 人口研究, 2008, 32(1): 51-57.
- ^ 4.0 4.1 柏中強, 王卷樂. 中國27 省鄉鎮(街道)級人口密度數據集(2000 年)[J/OL]. 中國科學數據, 2016, 1(1) : 1-6. DOI: 10.11922/csdata.170.2015.0002.
- ↑ 王明明, 王卷樂. 山東省鄉鎮級格網化人口空間分布數據集(2000、2010年)[DB/OL]. Science Data Bank, 2019. (2019-02-28). DOI: 10.11922/sciencedb.736.
數據引用格式
編輯王卷樂, 王曉潔, 王明明, 等. 中國鄉鎮(街道)人口密度數據集(2010年)[DB/OL]. Science Data Bank, 2020. (2020-03-31). DOI: 10.11922/sciencedb.964.