中國西南野生生物種質資源數據庫

中國西南野生生物種質資源數據庫
作者:李拓徑 李洪濤 李德銖
2018年3月7日
本作品收錄於《中國科學數據
李拓徑, 李洪濤, 李德銖. 中國西南野生生物種質資源數據庫[J/OL]. 中國科學數據, 2018, 3(1). (2018-02-23). DOI: 10.11922/csdata.2017.19.zh.


摘要&關鍵詞 編輯

摘要:中國西南野生生物種質資源庫是國家重大科學工程,在野生種質資源的收集保藏工作中扮演着重要角色,目的是保障國家重要戰略生物資源。本數據庫的構建開發,結合了野生生物種質資源收集和保藏的工作規範,主要包括採集、登記、檢測、鑑定、庫存和再生等方面信息,並按照相關管理辦法對外開展實物和數據的共享,為國內外研究機構、高等學校、政府職能部門和公眾提供服務。本數據庫已收錄植物種子、植物DNA樣品和植物離體材料等數據信息11.6萬餘條,用戶可以根據自己的需要對數據進行檢索。本數據庫的建設將有利於我國種質資源的收集、保藏和生物多樣性保護,對生態保護有積極的示範意義。

關鍵詞:野生生物;野生種質資源;戰略生物資源;數據庫

Abstract & Keywords 編輯

Abstract: Germplasm Bank of Wild Species is one of the large-scale scientific facilities in China, whose preserved wild germplasm constitutes an important national strategic biological resource. Data produced by the Germplasm Bank of Wild Species play a key role in the collection and preservation of wild germplasm. This database is built with modern computer information technologies based on standard specifications for the collection and preservation of wild germplasm. It stores and manages information on the collection, registration, examination, verification, curation, and regeneration of wild germplasm according to standard protocols, serving domestic and international research institutions, colleges and universities, government departments and the public. The database houses more than 116,000 pieces of data on such aspects as plant seeds, plant genomic DNAs, and plant in vitro materials. Users can retrieve data on the website of this database. The database will be conducive to the preservation and conservation of wild germplasm in China and has a positive demonstration significance for ecological protection and environmental management.

Keywords: wild species; wild germplasm; strategic biological resources; database

數據庫(集)基本信息簡介 編輯

數據庫(集)名稱 中國西南野生生物種質資源數據庫
數據作者 中國西南野生生物種質資源庫
數據通信作者 李德銖(dzl@mail.kib.ac.cn)
數據時間範圍 2005~2017年
地理區域 中國境內
數據格式 SqlServer
數據服務系統網址 http://www.genobank.org/http://www.sciencedb.cn/dataSet/handle/490
基金項目 中國西南野生生物種質資源庫國家大科學工程
數據庫(集)組成 本數據庫由野生植物種子數據71200多條,植物離體材料數據2000多條,植物DNA樣品數據43300多條等組成。

Dataset Profile 編輯

Title Germplasm bank of wild species in southwest China
Data author(s) Germplasm Bank of Wild Species
'Data c'orresponding author Li Dezhu (dzl@mail.kib.ac.cn)
Time range 2005–2017
Geographical scope China
Data format SqlServer
Data service system http://www.genobank.org/ http://www.sciencedb.cn/dataSet/handle/490
Source of funding Large-scale Scientific Facility of China on Germplasm Bank of Wild Species in Southwest China
Database composition The database consists of more than 71,200 pieces of data on wild plant seeds, over 2,000 pieces on plants in vitro materials, and over 43,300 pieces on plant genomic DNAs.


引 言 編輯

中國西南野生生物種質資源庫(簡稱種質庫)是國家大科學工程。其總體科學目標是:立足西南,面向全國,建成具有國際影響力、亞洲一流的野生生物種質資源保護設施和科學體系[1]。其保藏的野生種質資源是國家重要的戰略生物資源,具有重要的科學和經濟價值,對社會經濟可持續發展和生態文明建設具有重要意義[2]。在參考英國皇家植物園邱園「千年種子庫」保藏模式的基礎上,基於種質庫的資源保藏目標和科研工作流程,按照「科學規劃、逐步推進」的原則,以工作業務流程為基礎,設計數據庫模型,採用模塊化技術將種質資源採集、處理、保藏、功能基因挖掘等科研活動數據的存儲、管理、集成、檢索、維護和分析統計融為一體,建成基於B/S架構(Browser/Server架構,即瀏覽器和服務器架構)的種質庫信息管理系統(Germplasm Bank Information System,簡稱GBIS系統),從而構建種質資源採集保藏研究的國家戰略種質資源保藏信息系統[3]。在信息系統管理的基礎上,通過各個業務模塊數據的合成、關聯,有效形成野生種質資源數據庫。

中國西南野生生物種質資源數據庫收錄了野生植物種子、植物DNA樣品、植物離體材料以及動物材料和微生物資源等的各類保藏相關信息,包括登記管理信息、監測信息、庫存信息、實驗及使用信息等。其中野生植物材料數據超過11.6萬條,全部對外公開查詢,是本文闡述的主體;另有動物材料數據53800餘條和微生物資源數據2200餘條暫未對外公開展示,因而在本文中未詳細描述。各類信息以關係型數據庫的方式進行存儲,並且可通過數據庫實現自動備份、恢復。

除此之外,為了進一步規範種質資源的分類信息管理,其基礎數據庫建立了以Flora of China[4](以下簡稱FOC)為主、The Plant list[5](以下簡稱TPL)為輔的植物分類學名稱體系,以實現植物分類學名稱數據庫系統內的統一審核、規範等功能。並且系統整理FOC相關性狀描述信息和圖片信息,形成種質資源分類學基礎名錄數據庫。基礎名錄數據庫成功地與GBIS系統結合,為採集策劃、物種鑑定和分析統計等提供數據依據,確保野生種質資源採集、保藏、研究過程中數據的合理性、規範性。目前,本數據庫已經開放共享,並支持申領可分發實物資源。

1 數據採集和處理方法 編輯

作為國家的重大科技基礎設施,種質資源的保藏與創新有着一套嚴格、標準的工作流程,基本分成4個關鍵環節和9個組成部分[3]。4個關鍵環節為:採集計劃、監測評價、實驗分析和研究創新。這4個環節可分解為9個有序的部分:採集計劃、野外採集、種子清理、質量檢測、入庫保存、活力檢測實驗(TZ實驗,TZ即氯化三苯基四氮唑triphenyltetrazolium chloride)染色法、創新研究、再生擴繁、開發利用[3]。這些工作分別由不同的部門承擔,在每一個活動部門都有嚴格的操作流程和標準規範,在每一個關鍵環節都需要依賴原有的科學積累和分析實驗設備,並產生大量的數據。因此,這4個環節之間如何有效、科學地協作,並達到數據積累和分析的目的,是種質資源保藏與創新成功的關鍵。

1.1 數據採集方法 編輯

種質資源數據主要來源於自2005年11月組建種質保藏團隊至今的野生種質資源野外調查及保藏管理、研究等各項數據。數據採集建立了嚴格規範的標準流程(圖1),本數據庫首先由管理人員根據採集材料遞交情況進行GBIS系統登記,然後採集人員通過離線或在線的方式補充野外採集信息,標本鑑定人員通過在線方式審核完善鑑定信息,管理人員通過實驗檢測生成檢測數據信息,實驗人員通過信息系統在線管理和完成實驗信息的錄入。由此產生以種質資源實物登記為中心的中國西南野生生物種質資源數據庫。數據庫通過關係數據庫關聯的模式,實現各個模塊分塊工作、有效關聯等功能,實現數據的標準化,系統有效地形成數據關聯,為種質資源統計分析和應用奠定基礎。


圖片

圖1 野生植物種子採集保藏流程圖


1.2 數據的加工與處理 編輯

GBIS系統根據野生種質資源採集保藏的特點建立了標準化工作模式(圖2),數據信息主要通過GBIS系統進行標準化錄入。在借鑑英國「千年種子庫」工作經驗的基礎上,種質庫的種質採集保藏工作主要由種質資源的採集、登記、處理、保藏等前期工作,以及萌發、TZ染色實驗、水分測試等後期工作組成。為了能夠全面準確地信息化種質資源的保藏活動,GBIS系統以模塊化設計和開發的形式完全融合了保藏種質資源的全部工作流程。每個模塊的數據錄入、校驗、存儲均由系統統一控制,規範數據的格式和內容,確保數據錄入的準確性。在關鍵數據部分,採用二次鑑定和方差分析的方式實現人工或者自動化加工處理,確保數據的準確性。


圖片

圖2 GBIS系統工作模式


2 數據樣本描述 編輯

本數據庫目前收錄了超過11.6萬條對外公開查詢的信息數據,分別記錄了:野生植物種子數據71200餘條,涉及220科1940屬9484種;植物離體材料數據2000餘條,涉及104科377屬1850種;植物DNA樣品數據43300餘條,涉及189科1462屬4864種。

數據樣本以野生植物種子數據為例。其記錄的信息包括序列號、採集編號、採集單位、負責人、採集年份、國家、省、市、區縣、科中文名、科拉丁名、屬中文名、屬拉丁名、種中文名、種拉丁名、鑑定人、鑑定日期、圖像、千粒重(克)、剩餘種子數(表1)。


表1 毛柄杜鵑採集保藏數據展示

字段名稱 示例
序列號 868710142722
採集編號 YDDXS0690
採集單位 雲南永德大雪山國家級自然保護區管理局
負責人 李永亮
採集年份 2011
國家 中國
雲南省
臨滄地區
區縣 永德縣
科中文名 杜鵑花科
科拉丁名 Ericaceae
屬中文名 杜鵑屬
屬拉丁名 Rhododendron
種中文名 毛柄杜鵑
種拉丁名 Rhododendron valentinianum Forrest ex. Hutchinson
鑑定人 李錫文(Li X. W.)
鑑定日期 2011-06-14
圖像 IMAGE
千粒重(克) 0.0596000
剩餘種子數(粒) 62945


3 數據質量控制和評估 編輯

本數據庫的數據主要來源於種質庫採集保藏工作的各個環節。首先制定了針對種質資源採集保藏的標準規範,如由採集部門制定的種子採集技術規範,系統地規範了採集過程中產生的各個資源項,如採集號編寫、採集地點、經緯度、生境等諸多信息[6]。其次,在標準規範的基礎上,依賴GBIS系統構建的關係型數據庫,數據質量得到有效的控制。在應用數據庫設計的同時,對常用項進行數據字典規範化,有效把控錄入數據的質量。數據字典是GBIS系統中各類數據描述的集合,是詳細描述各項種質資源數據收集和統計分析所獲得的主要成果。例如在物種名稱字典中,我們將FOC和TPL進行結合,得到標準的植物名稱字典數據。在實際應用中,用戶在錄入時候通過選擇標準植物名稱,以達到規範植物名稱規範輸入的目的。

通過GBIS系統的有效錄入和嚴格審核,實現了數據的有效管理,數據質量得到較大的提升,有效支持了中國西南野生生物種質資源庫的各項研究工作。以野生植物種子保存為例,數據經歷登記、質量檢測、計數審核、標本鑑定和採集校驗等多個環節。每個環節的數據均通過人工審定確認,以將錯誤率控制在1%以下。

4 數據價值 編輯

本數據庫系統反映中國西南野生生物種質資源庫的運行狀態,並且涵蓋了種質庫的各項種質資源的保藏研究工作。例如數據庫能夠系統統計出保藏的科、屬、種情況以及資源的利用狀況。通過數據庫集中數據,可以挖掘、評估種質資源的潛在價值,為進一步利用種質資源提供依據。本數據庫收集了2005年至今10餘年的野生種質資源保藏狀況,並建立了方便的查詢平台,對植物分類學、系統學、種子生物學、植物基因組學研究乃至整個植物學研究提供了有效的支撐。

5 數據使用方法和建議 編輯

本數據庫主要通過http://www.genobank.org/提供web數據服務,在Science Data Bank http://www.sciencedb.cn/dataSet/handle/490也有访问入口。用户可以在输入框中输入物种名或者编号进行检索,或输入物种性状进行全文搜索。同时,注册用户经过电子邮箱验证后,可以进行种名和区域名称的精确查询。如果用户需要对某一类群资源或者定制某些特定字段数据进行批量数据获取,可以通过联系本数据库相关管理人员获取。

致 謝 編輯

本數據庫得到中國科學院重大科技基礎設施運行費的支持,數據主要來源於中國科學院昆明植物研究所所屬種質資源保藏中心、分子生物學實驗中心和標本館等相關部門,在此表示衷心感謝!

參考文獻 編輯

  1. 中國西南野生生物種質資源庫[DB/OL]. (2015–01–13) [2017–09–15]. http://news.genobank.org/bmjs/zykjj/.
  2. LI D Z, PRITCHARD H W. The science and economics of ex situ plant conservation [J]. Trends in Plant Science. 2009, 14(11): 614–621.
  3. ^ 3.0 3.1 3.2 王雨華, 李德銖. 國家戰略種質資源保藏與創新系統的e-Science環境[J]. 科研信息化技術與應用, 2009 (02): 32–39.
  4. 吳征鎰. 中國植物志(英文版). Flora of China [M]. 北京: 科學出版社, 2013.
  5. The Plant list [DB/OL]. [2017–09–15]. http://www.theplantlist.org/.
  6. 蔡傑, 張挺, 劉成, 等. 野生植物種子採集技術規範[J]. 植物分類與資源學報, 2013, 35(3): 221–233.

數據引用格式 編輯

中國西南野生生物種質資源庫. 中國西南野生生物種質資源數據庫[DB/OL]. Science Data Bank, 2017. (2017-09-29). DOI: 10.11922/sciencedb.490.


 

本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse