中國農業資源區劃數據集
中國農業資源區劃數據集 作者:鄒金秋 陳佑啟 2018年6月20日 |
|
摘要&關鍵詞
編輯摘要:農業資源調查與農業區劃是農業發展的基礎性、綜合性的長期工作,從中華人民共和國成立以來始終被列為國家長期研究的重要任務。我國先後開展了三次全國性大規模的農業區劃工作,獲得了全國共2 108個縣(按80年代初的行政區劃)的農業資源調查和農業區劃資料,取得了全國農業現狀區劃、中華人民共和國自然地理圖集等一批重要成果。並在此基礎上進行了全國以及不同地區(縣級,部分地區到鄉級)的各種專業性的農業區劃與區域性的綜合區劃,取得了成套系統的有關全國以及不同規模尺度上的農業資源及其區劃成果圖件、統計數據與研究報告,共包括8萬多項成果和報告,以及4萬多幅圖件。這套數據是目前我國有關農業資源信息與區劃成果的唯一、完整和系統的數據,在查清農業資源家底、合理利用資源、監測資源動態、研究農業發展戰略、建立農產品商品基地及農業地區開發、調整農業結構、因地制宜合理布局生產力等方面提供了大量科學基礎資料,對擬定與落實農業發展規劃,保護農業資源,挖掘農業生產潛力,合理布局與配置農業資源,提高農業綜合生產力,促進農業和農村持續發展等起到了極大作用。
關鍵詞:農業資源;農業區劃;科學數據;數據共享
Abstract & Keywords
編輯Abstract: Survey and regional mapping of agricultural resources is a long-term basic and comprehensive work of agricultural development. It has been listed as an important task in long-term national research plans since the founding of P. R. China. Agricultural mapping at regional scale has been conducted nationwide three times afterwards, which collected data of agricultural resources and their regional mapping in more than 2108 counties (as per the administrative divisions in the early 1980s), including a huge set of maps, statistical data and reports. This dataset contains the most complete and systematic information about agricultural resources and their regional mapping. It is vital for agricultural resource monitoring and utilization, agricultural regional planning, the formulation of regional agricultural policies, the adjustment of agricultural structure and measurement, the promotion of agricultural productivity, and so on.
Keywords: agricultural resources; agricultural regionalization; scientific data; data sharing
數據庫(集)基本信息簡介
編輯數據庫(集)名稱 | 中國農業資源區劃數據集 |
數據作者 | 陳佑啟、鄒金秋 |
數據通信作者 | 鄒金秋(zoujinqiu@caas.cn) |
數據時間範圍 | 1949~2016年 |
地理區域 | 北緯3°52′~53°33′,東經73°40′~135°2′,地理區域範圍涉及到的國家包括中國。 |
數據量 | 1263748 MB |
數據格式 | *.doc, *.pdf, *.xls, *.shp等 |
數據服務系統網址 | http://region.agridata.cn/;
http://agri.ckcest.cn/appcenter/proapp/29.html; http://www.sciencedb.cn/dataSet/handle/539 |
基金項目 | 科技基礎性工作專項項目「科技基礎性工作數據資料集成與規範化整編」(2013FY110900),國家國際科技合作專項項目「天空地一體化精準農業物聯網平台聯合研發」(2014DFE10220),農業區劃科 學數據挖掘利用研究(720-36)。 |
數據庫(集)組成 | 中國農業資源區劃數據集由有關農業區劃的文本、統計數據及相關地圖數據組成,為了科學管理,總共分成綜合農業區劃數據庫、農業自然區劃數據庫、農業技術措施區劃數據庫、農業部門區劃數據庫、農村經濟區劃數據庫、其他專題區劃數據庫、農業區劃理論與方法信息數據庫、其他農業區劃信息數據庫,共8個數據庫。 |
Dataset Profile
編輯Title | The data set of agricultural resources and regional mapping in China |
Data corresponding author | Zou Jinqiu (zoujinqiu@caas.cn) |
Data authors | Chen Youqi; Zou Jinqiu |
Time range | 1949 – 2016 |
Geographical scope | Longitude & latitude: 3°52』 N – 53°33』 N, 73°40』』E – 135°2』 E; specific areas include China. |
Data volume | 1 263 748 MB |
Data format | *.doc, *.pdf, *.xls, *.shp, etc |
Data service system | <http://region.agridata.cn/>;
<http://agri.ckcest.cn/appcenter/proapp/29.html>; <http://www.sciencedb.cn/dataSet/handle/539> |
Sources of funding | The special project of basic work of science and technology, "data integration and standardization of basic work of science and technology" (2013FY110900);
The special project of international scientific and technological cooperation, "Joint research and development of the Internet of things platform on precision agriculture with an integration of aerospace-aviation-ground observation" (2014DFE10220); Research on scientific data mining and utilization of Agricultural Resources and Regionalization in China (720-36). |
Dataset composition | This dataset consists of data in text, statistics and map formats. For the convenience of scientific management, the dataset is made up of eight databases: ① Comprehensive agricultural zoning database; ② Agricultural natural zoning database; ③ Agricultural technical measures zoning database; ④ Agricultural sector division database; ⑤ Rural economic division database; ⑥ Other thematic zoning databases; ⑦ Agricultural zoning theory and method database; ⑧ Other agricultural zoning information databases. |
引 言
編輯農業資源調查與農業區劃是農業發展的基礎性、綜合性的長期工作,從中華人民共和國成立以來始終被列為國家長期研究的重要任務。我國先後開展了三次全國性大規模的農業區劃工作。1953~1957年,當時的中央農業部計劃經濟局直接負責全國農業區劃工作,各大區的農林部及農業廳局的計劃部門均建立了相應的農業區劃管理部門,具體組織農業資源調查和農業區劃研究。這一期間,主要工作集中在農業自然區劃草案的編制與自然區劃方法的研究等方面。1963年,中央國務院召開的「全國農業科學技術工作會議」把農業自然資源調查和農業區劃列為十年全國農業科學技術發展規劃的第一項重點項目。1978年,中央召開的「全國科學技術大會」,把「全國農業自然資源調查和農業區劃研究」列為1978~1985年期間全國科學技術規劃綱要重點科學技術研究項目中的第一項。1979年國務院國發(1979)36號文指出:開展農業自然資源和農業區劃的研究是合理利用農業自然資源,發展農業生產,建立科學管理,實現農業現代化的重要的基礎工作;各有關部、各省、市、自治區必須積極地、有計劃地、長期地進行下去;並決定成立全國農業資源調查和農業區劃委員會及辦公室。在委員會主任委員、國務院副總理王任重的親自領導下,國家農委、國家科委、農業部等有關部委組織省、地、縣各級區劃部門與科研單位參加,分期分批地開展了全國農業資源調查和農業區劃工作。這項工作共動員了近百萬人參與,獲得了全國共2108個縣(按80年代初的行政區劃)的農業資源調查和農業區劃資料;取得了「全國農業現狀區劃」「中華人民共和國自然地理圖集」等一批重要成果,並在此基礎上進行了全國以及不同地區(縣級,部分地區到鄉級)的各種專業性的農業區劃與區域性的綜合區劃,取得了成套系統的有關全國以及不同規模尺度上的農業資源及其區劃成果圖件、統計數據與研究報告,共包括8萬多項成果和報告,以及4萬多幅圖件。這套成果經全國農業區劃委員會科學技術成果評審組評定,共評出一等獎12項、二等獎52項、三等獎229項。其中,「中國綜合農業區劃」獲國家科技進步一等獎[1]。
這套數據是目前我國唯一、完整和系統的有關農業資源信息與區劃成果的數據。這些農業資源信息與區劃成果在查清農業資源家底、合理利用資源、監測資源動態、研究農業發展戰略、建立農產品商品基地及農業地區開發、調整農業結構、因地制宜合理布局生產力等方面提供了大量科學基礎資料,對擬定與落實農業發展規劃,保護農業資源,挖掘農業生產潛力,合理布局與配置農業資源,提高農業綜合生產力,促進農業和農村持續發展等起到了極大作用。
在空間信息技術、計算機網絡技術等新技術的推動下,資源信息化建設及共享利用早已成為共識,各單位都開展了信息化工作。2002年,國家信息化領導小組發布了《關於我國電子政務建設指導意見》(中辦發〔2002〕17號文件),提出了推進我國電子政務建設的指導意見,開啟了信息化發展的新紀元。目前,我國的信息化基礎設施發生了巨大變化,各「金字號」工程建設、「國家科學數據共享平台」等項目建設等相繼完成,搭建了國內最大的「國家農業科學數據共享中心」,大大提高了我國農業信息化水平。
「全國農業資源區劃數據集」從2002年開始建設,分別獲得了農業部、科技部的資助。其中,國家農業科學數據共享中心—區劃科學數據分中心完成數據採集與共享平台建設,是國內最大的農業區劃數據資源平台。目前,共包括164 658個真實數據,分成五大數據庫39個數據集,長期開展對外免費公益共享,實名制註冊用戶超7 000人,共享平台日訪問量超3 000次以上,產生了良好的社會效益。
1 數據採集和處理方法
編輯全國農業資源區劃科學數據大部分是紙質圖書資料,保存在中國農業科學院農業資源與農業區劃研究所,同時有大量的圖書存放在省級農業資源區劃管理部門。圖1為中國農業科學院農業資源與農業區劃研究所農業區劃圖書館館藏圖書情況。
圖1 原始資料保存狀況
針對這些紙質圖書數據,採用人工電子化錄入的方法進行數據採集。在國家科技部基礎性工作及平台項目的資助下,開展資源數據庫建設。國家農業科學數據中心區劃科學分中心根據需要採集的數據類型及現狀,制定了科學的數據採集方法與技術流程[2]。圖2詳細說明了工作方法與處理流程。
圖2 數據採集與處理流程
數據採集方法如下:1)制定科學的數據錄入與校驗標準,將相關數據進行科學分類,並由數據採集員分類錄入。2)針對書本中文字資料,採用人工錄入的方式電子化後,安排不同人員進行一審和二審校對,保證文字錄入正確率99%以上,並保證文字排版和原書本排版一致,錄成電子版本後將文件保存成WORD格式。3)針對其中的表格數據,除在WORD文件中以表格形式保存外,還單獨提取至EXCEL軟件中保存成*.xls文件,以便進行查詢統計分析。4)針對其中的地圖數據,除將圖片掃描後保存到WORD文件外,還利用GIS軟件對圖片進行矢量化,賦予正確的投影和坐標,並保存成通用的SHP文件格式。5)針對照片或者多媒體數據,單獨保存成JPG格式或者流媒體格式。6)數據採集員完成數據採集後,將數據提交到數據庫管理員。數據管理員對數據進行精度驗證以後,利用開發的管理軟件建立每個真實數據的元數據信息,詳細說明數據的來源、質量及使用情況。並將數據入庫,在數據共享平台http://region.agridata.cn/發布並共享。7)用戶通過實名制註冊模式訪問共享平台,可以查詢和瀏覽本數據庫的全部數據信息(包括各文件對應的元數據及真實文件數據)。
數據庫管理與共享平台利用Oracle數據庫軟件作為基礎數據管理軟件平台,基於ArcGIS軟件進行系統集成與開發。管理系統為單機版本的數據分析利用軟件,共享平台為基於WebGIS模式開發的網路共享平台,利用該平台實現數據的免費共享,見圖3。用戶除查詢和瀏覽數據外,如確需真實數據時,可以在線申請獲取真實數據。數據管理員通過對數據密級、申請用戶信息進行審核後,批准是否可以通過數據下載。一旦通過,用戶再次登錄時即可在線下載對應的真實文件數據。
圖3 數據共享平台
2 數據樣本描述
編輯在數據庫中,共有文本數據28151個、統計數據31371個、矢量地圖數據2196個、柵格數據10914個、多媒體數據64個,總數據72696個。每個數據的組織與管理模式都相同,針對每個科學數據,實體文件數據保存成對應的文件格式。其中文本數據的格式為doc、txt、pdf等;統計數據為dbf、xls;地圖數據為shp;柵格數據為tif、img等。
針對每個真實文件,分別建立該數據完整的元數據說明信息。用戶首先瀏覽的是該數據的元數據信息,通過查閱該數據的時間、摘要、關鍵詞、精度、數據格式等信息後判斷該數據是否符合自身需求。如符合,可以直接申請下載。
用戶登錄,通過輸入查詢條件,數據查詢結果如圖4。點擊數據名稱,可以查看該數據的元數據。
圖4 數據查詢結果
以「河南省農業區域綜合開發總體規劃」數據文件為例,點擊該數據名稱,會彈出下圖5對應的該文件對應的元數據說明信息,主要包括數據中文名稱、英文名稱、關鍵詞、數據摘要、數據產生日期、數據版本信息、數據文件語種、數據生產目的、數據所有人及元數據所有人信息等。
查閱元數據後,可以看到圖5下方「真實文件名」處有個「數據請求」的命令按鈕,如果需要該數據,點擊此命令申請下載。數據管理員會在1個工作日內審理此數據是否許可下載。如通過,用戶再次登錄時,會有提示在線下載該文件的信息,見圖6。
圖5 元數據實例
圖6 真實文件下載信息
3 數據質量控制和評估
編輯在數據採集與數據庫建設過程中,採用了嚴格的數據質量管理標準體系。按照圖7所示的數據質量控制流程,每個數據採集過程都經過嚴格的一審和二審程序。對每一個文件都進行錯誤率統計,儘可能將誤差降低到最小程度,以保證數據錄入過程中誤差控制在0.1%以下。誤差率計算方法為:千字中錯別字(包括標點符號和數字錯誤)個數占比;同時還需要綜合考慮排版錯誤、表格數據中的數字錯誤、地圖數據考慮投影坐標和邊界走勢錯誤、文件命名誤差等。每本紙質圖書由數據採集員1進行電子化錄入,然後交數據採集員2進行排版與誤差率校核計算;初步符合要求後交二審採集員3,二審採集員3再次對數據質量進行校核,確認誤差在0.1%以下後,建立數據的元數據信息,元數據的建立應符合農業科學數據核心元數據中規定的要求[3],然後提交數據管理員。
圖7 數據質量控制流程
對於地圖數據,在賦予投影與坐標時也充分注意到誤差控制。在矢量化過程中尤其要求數據的精細化操作,電子地圖圖片掃描時要求不變形、大於500點以上像素掃描;導入GIS軟件後,進行數據投影與坐標配准,坐標糾正點不少於40個;數據電子化跟蹤過程要求與圖片地圖點、線要素咬合度大於98%;錄入和建立矢量屬性時,要求字符錯誤率在1%以下。
總之,在數據採集過程中,這套數據有嚴格的數據精度保證措施。但是鑑於這套科學數據產生時間相對較早,90%以上數據產生於2000年前,75%左右的數據形成於20世紀80年代。隨着國家經濟建設發展,部分農業資源統計數據已經與現狀不符,比如土地利用統計數據,後備耕地資源數據、農業種植和受災面積、農業養殖統計數據等,因此這些數據為歷史存底數據,不能作為現時數據進行科學決策。
4 數據價值
編輯本套數據在現代農業園區規劃、兩區劃定、優勢農產品布局、農業產業結構調整及後備資源分析等農業生產管理決策過程中,具有巨大的使用價值。本套數據是我國農業科學工作者在國家極其困難的情況下,花費大量人力、財力收集和整理的珍貴歷史資料,摸清了我國農業資源家底,並結合專家知識生產的成套農業區劃資源數據集。雖然當時受資源調查手段、圖件製作技術及定量評價模型等缺乏的因素制約,但是總體數據精度是非常高。本套數據是國內外唯一的符合我國國情的數據資源,應該受到足夠的重視和保護。
5 數據使用方法和建議
編輯本套數據可以作為歷史資料分析國內農業資源狀況。同時這套數據凝聚了老一輩科學家大量的智慧,科學合理地劃分了國內各種作物與資源的分布區域,在自然規則沒有發生大改變的前提下,這些數據知識是完全可以利用的。
但是由於數據採集時間相對較早,隨着我國社會經濟發展,有些現實情況已經有所改變,因此對於這套資源數據中各類生產和加工的統計數據,建議僅作為歷史資料進行對比分析;對於其中各類規劃分布圖等數據,完全可以直接使用或者適當修改後使用,大部分數據使用者反饋表明,這些科學數據依然適用於現代農業布局與區劃。
本數據集也在不斷地收集和更新相關數據,尤其是隨着現階段「天空地」一體化的更新技術及手段的出現,信息在膨脹和擴張。用戶完全可以綜合多方面的信息來源,進行數據融合、同化和挖掘後提取最有價值的數據信息。
參考文獻
編輯數據引用格式
編輯陳佑啟, 鄒金秋. 中國農業資源區劃數據集. [DB/OL]. Science Data Bank, 2017. (2017-12-02). DOI: 10.11922/sciencedb.539.