台灣及周邊島嶼氣象水文觀測數據集
台灣及周邊島嶼氣象水文觀測數據集 作者:韓玉康 趙艷玲 關吉平 申曉瑩 陳飛 2020年4月22日 |
|
摘要&關鍵詞
編輯摘要:氣象水文數據是開展氣象水文預報預測、科學研究、開發利用和工程建設的基礎,是氣象水文科學發展的原動力。台灣及其周邊島嶼地理位置和戰略位置十分重要,並具有獨特的氣候水文環境和變化特點,而國內在該地區的氣象水文觀測資料稀缺。通過Python網絡爬蟲技術,從互聯網自動、定時收集下載台灣氣象局網頁公布的氣象水文公共服務信息數據,對原始數據進行處理、加工和標準化格式存儲,製作了標準規範的台灣及周邊島嶼的氣象水文觀測數據集,總大小2.0 MB,包括金門浮標、馬祖浮標等16個海洋環境觀測浮標的氣溫、風、有效波高等8個氣象水文要素的日平均數據,時間範圍2015–2019年,共16個數據表格1.5 MB;台北、新竹等26個氣象觀測站的降水月平均資料,時間範圍2010–2018年,共26個數據表格500 KB。為台灣及周邊島嶼的氣象水文科學研究提供數據基礎支撐。
關鍵詞:台灣;島嶼;氣象水文;觀測數據
Abstract & Keywords
編輯Abstract: Meteorological and hydrological data is the foundation of meteorological and hydrological prediction, scientific research, development and utilization, and engineering construction, and the driving force of the development of meteorological and hydrological science. The geographical position and strategic position of Taiwan and its surrounding islands are very important, and they have unique climatic and hydrological environment and change characteristics, while the meteorological and hydrological observation data in this area are scarce in China. Through Python web crawler technology, collect and download the meteorological and hydrological public service information data published on the web page of Taiwan Meteorological Administration from the Internet automatically and regularly, process and store the original data in a standardized format, and make a standardized meteorological and hydrological observation dataset of Taiwan and its surrounding islands, with a total size of 2.0 MB, including the daily average data of 8 Meteorological and hydrological elements such as temperature, wind and effective wave height of 16 ocean environment observation buoys such as Jinmen buoy and Mazu buoy, with a time range of 2015–2019, a total of 16 data tables of 1.5 MB; the monthly average precipitation data of 26 meteorological observation stations such as Taipei and hsinchu, with a time range of 2010–2018, with a total of 26 data tables of 500 KB. It provides data base support for meteorological and hydrological research in Taiwan and its surrounding islands.
Keywords: Taiwan; island; meteorology and hydrology; observation data
數據庫(集)基本信息簡介
編輯數據庫(集)名稱 | 台灣及周邊島嶼氣象水文觀測數據集 |
數據作者 | 韓玉康、趙艷玲、關吉平、申曉瑩、陳飛 |
數據通信作者 | 關吉平(yukang_han@163.com) |
數據時間範圍 | 海洋浮標觀測數據:2015年8月1日至2019年6月30日 氣象觀測站降雨資料:2010年1月1日至2018年12月30日 |
地理區域 | 台灣及周邊島嶼 |
數據量 | 2.0 MB |
數據格式 | *.xlsx |
數據服務系統網址 | http://www.sciencedb.cn/dataSet/handle/972 |
數據庫(集)組成 | 本數據集包括兩部分內容:一是金門、馬祖、澎湖、東沙島、鵝鑾鼻、富貴角、龜山島、花蓮、琉球嶼、龍洞、彌陀、七股、七美、蘇澳、台東、新竹共16個海洋氣象水文觀測浮標的2015–2019年的日平均數據,共16個數據表組成,總大小1.5 MB,包含氣溫、氣壓、表層水溫、風速、風向、瞬時風速、有效波高、流速8個氣象水文要素。二是金門、馬祖、澎湖、阿里山、鞍部、大武、淡水、東吉嶼、高雄、恆春、花蓮、基隆、嘉義、蘭嶼、彭佳嶼、日月潭、蘇澳、台北、台東、台南、台中、梧棲、新竹、宜蘭、玉山、竹子湖26個氣象觀測站降雨的月平均數據,共26個數據表組成,總大小500 KB,包括月降雨量、月降雨日數、最大日降雨量3個要素。 |
Dataset Profile
編輯Title | A meteorological and hydrological observation dataset of Taiwan and its surrounding islands |
Data corresponding author | Guan Jiping |
Data authors | Han Yukang, Zhao Yanling, Guan Jiping, Shen Xiaoying, Chen Fei |
Time range | Ocean buoy observation data: August 1, 2015 to June 30, 2019; Rainfall data of meteorological observation station: January 1, 2010 to December 30, 2018 |
Geographical scope | Taiwan and its surrounding islands |
Data volume | 2.0 MB |
Data format | *.xlsx |
Data service system | < http://www.sciencedb.cn/dataSet/handle/972> |
Dataset composition | This data set includes two parts: one is the daily average data of 16 marine meteorological and hydrological observation buoys in 2015-2019, consisting of 16 data tables, with a total size of 1.5 MB, including 8 Meteorological and hydrological elements, i.e. air temperature, air pressure, surface water temperature, wind speed, wind direction, instantaneous wind speed, effective wave height and velocity. The second is the monthly average rainfall data of 26 meteorological observation stations in Jinmen, Mazu, Penghu, Alishan, Anshan, Dawu, Danshui, dongjiyu, Kaohsiung, Hengchun, Hualian, Keelung, Jiayi, Lanyu, pengjiayu, Riyuetan, su'ao, Taibei, Taidong, Tainan, Taichung, Wuqi, Xinzhu, Yilan, Yushan and Zhuhu, with a total size of 500 KB, including monthly rainfall, monthly rainfall days and maximum daily rainfall. |
引 言
編輯氣象水文數據是開展氣象水文預報預測、科學研究、開發利用和工程建設的基礎,是氣象水文科學發展的原動力[1],在研究氣候變化、增強氣象水文預報保障能力、開發利用氣象水文環境資源、陸地和海洋工程建設和國民經濟、**等方面具有十分重要的意義。
台灣及周邊島嶼位於東亞沿岸,背靠歐亞大陸,東臨太平洋,是連接太平洋和南海、印度洋的重要地理和戰略位置,主要包括台灣島以及金門、馬祖、澎湖列島、琉球嶼、東沙島等台灣「離外島」,海洋觀測浮標和氣象觀測站位置如圖1。因地理位置和地形特殊,台灣及其周邊島嶼具有獨特的氣候水文環境和變化特點,也是氣象海洋學家關注的重點[2][3]。收集整編台灣及周邊島嶼的氣象水文觀測資料,對於其氣象水文環境科學研究和實際利用具有較為重要的價值和意義。
圖1 海洋浮標位置(上圖)和氣象觀測站位置(下圖)
目前國內還未見台灣及周邊島嶼的氣象水文數據公開發表,互聯網公布的氣象水文觀測信息通過服務信息形式發布,定期更新,只存留一定時間。鑑於此,本文通過Python網絡爬蟲技術,從互聯網自動、定時收集下載台灣氣象局網頁公布的氣象水文公共服務信息數據,對原始數據進行處理、加工和標準化格式存儲,製作了標準規範的台灣及周邊島嶼的氣象水文觀測數據集,便於讀取和使用,以期為氣象水文科學研究提供數據基礎支撐。
1 數據採集和處理方法
編輯1.1 數據源
編輯本研究數據來源台灣氣象局公布的氣象水文服務信息,通過Python網絡爬蟲技術,定時、自動下載。其中,海洋浮標觀測資料自2015年8月1日開始,累積至2019年6月30日,為每小時1次,為每天24次,均為氣象海洋環境浮標所載觀測儀器自動觀測所得。原始數據網頁保存30天,逐日更新、遞推,過期無法下載獲取;氣象觀測站降雨資料為逐日資料,為雨量自動觀測儀觀測所得,包含日降雨量1個要素,時間範圍2010–2018年,每日更新數據。
1.2 數據收集與處理
編輯首先利用Python網絡爬蟲技術,進行相關網頁的數據自動、定時爬取,存儲至本地數據庫,解決了互聯網數據零散、下載複雜、人工定時下載難度大的問題。對於收集的原始數據,利用Matlab語言編程進行數據處理加工,求取各要素日平均值、月平均值和其他特徵量值,形成日平均和月平均數據,以相對標準、實用的數據形式存儲為新的表格型數據(xlsx)格式,統一規範命名。
2 數據樣本描述
編輯2.1 數據集結構
編輯本數據集包括兩部分內容,總大小2.0 MB:一是金門等16個海洋環境浮標的2015–2019年的氣象水文要素的日平均數據,共16個數據表組成,大小1.5 MB,包含氣溫、風等8個氣象水文要素;二是台北等26個氣象觀測站降雨的月平均數據,共26個數據表組成,大小500 KB。具體數據集組成如表1。
表1 數據集組成
數據名稱 | 要素種類 | 觀測站 | '數據格式'數據量 | '數據'類型 |
氣象水文浮標觀測數據集 | 氣溫、氣壓、表層水溫、風速、風向、瞬時風速、有效波高、流速 | 金門、馬祖、澎湖、東沙島、鵝鑾鼻、富貴角、龜山島、花蓮、琉球嶼、龍洞、彌陀、七股、七美、蘇澳、台東、新竹 | 表格型xlsx1.5 MB | 日平均 |
降雨數據集 | 月降雨量、月降雨日數、最大日降雨量 | 金門、馬祖、澎湖、阿里山、鞍部、大武、淡水、東吉嶼、高雄、恆春、花蓮、基隆、嘉義、蘭嶼、彭佳嶼、日月潭、蘇澳、台北、台東、台南、台中、梧棲、新竹、宜蘭、玉山、竹子湖 | 表格型xlsx500 KB | 月平均 |
2.2 數據屬性表
編輯各浮標氣象水文觀測數據表和各氣象觀測站降雨數據表均包括測站信息、觀測時間和要素數值三部分內容,數據表中的字段名稱、量綱、數據類型、數據樣例等信息具體如表2和表3。
表2 各浮標觀測氣象水文數據表內容
表內容序號 | 字段名稱 | 量綱 | 數據類型 | 數據樣例 |
1 | 測站名稱 | - | 文本型 | 金門浮標 |
2 | 測站經度 | °E | 數值型 | 118.41 |
3 | 測站緯度 | °N | 數值型 | 24.38 |
4 | 年 | - | 數值型 | 2019 |
5 | 月 | - | 數值型 | 6 |
6 | 日 | - | 數值型 | 30 |
7 | 氣溫 | ℃ | 數值型 | 28.4 |
8 | 氣壓 | hPa | 數值型 | 1002.1 |
9 | 表層水溫 | ℃ | 數值型 | 29.6 |
10 | 風速 | m/s | 數值型 | 4.5 |
11 | 風向 | ° | 數值型 | 193.6 |
12 | 瞬時風速 | m/s | 數值型 | 5.8 |
13 | 有效波高 | m | 數值型 | 0.8 |
14 | 流速 | cm/s | 數值型 | 26.7 |
表3 各氣象觀測站降雨數據表內容
表內容序號 | 字段名稱 | 量綱 | 數據類型 | 數據樣例 |
1 | 測站名稱 | - | 文本型 | 阿里山 |
2 | 測站經度 | °E | 數值型 | 120.8 |
3 | 測站緯度 | °N | 數值型 | 23.52 |
4 | 年 | - | 數值型 | 2010 |
5 | 月 | - | 數值型 | 1 |
6 | 月降雨量 | mm | 數值型 | 52.7 |
7 | 月降雨日數 | d | 數值型 | 8 |
8 | 最大日降雨量 | mm | 數值型 | 22 |
3 數據質量控制和評估
編輯本數據集原始數據均為氣象水文自動觀測平台觀測所得,觀測儀器定期檢測和維護保養,保證觀測的準確性。互聯網收集的氣象水文服務信息,在發布前,均已通過多種數據質量控制方法,進行過嚴格的質量控制,剔除異常值和錯誤值,數據真實、可信。在本數據集處理、製作過程中,嚴格處理流程和規範操作,各類氣象水文要素特徵量的計算方法科學,再次對數據的完整性、準確性進行檢查,確保數據處理、存儲過程科學、嚴謹,保證數據質量。
數據觀測過程中由於儀器缺測、剔除異常值、錯誤值等原因,存在部分無記錄資料,在計算要素的日平均值時,若某個要素該日的觀測次數不足12次,則本要素該日的均值不做計算,記作空值(以「99999」表示);在計算某個要素的月平均值時,若某個要素該月的觀測有效日數少於5日(1侯),則該月的均值不做計算,記作空值(以「99999」表示),以避免由於數據量過少導致的均值計算存在偏差。
4 數據價值
編輯本數據集收集整編了台灣及周邊島嶼的浮標觀測的氣象水文資料和氣象觀測站的降水資料,處理加工,形成了格式統一規範的日平均的氣象水文浮標觀測數據集和降水數據集,填補了國內在台灣及周邊島嶼地區的氣象水文觀測資料的嚴重缺乏,有利於我們更好的開展該地區的氣象水文環境研究,加強了解認識,為實際利用打下良好基礎。
例如我們分析了馬祖浮標觀測的1月份和7月份海面風場特點,可以看出,1月風向以東北風為主,最大概率風向為NE,占48.9%,次大概率風向為NNE占21.47%,1月風速整體大於7月,1月平均風速7.1 m/s,6級以上大風概率11%,7月平均風速4.9 m/s,6級以上大風只占1%(圖2)。分析了台灣及周邊島嶼1月和7月的降雨特點,可以看出,1月和7月的降雨量在量級和地區分布均有較大差別:1月降雨量呈東北高、西南低、自東北向西南遞減的特點,東北部位於東北季風迎風坡,最大降雨量蘇澳氣象站觀測362.8 mm,西南部位於背風坡,降水量少,多各測站觀測在20 mm以下;7月受夏季風和熱帶氣旋影響顯著,降雨充沛,降雨量中部山區最多,阿里山氣象站觀測可達668.3 mm,其次是西南地區,北部地區降雨量最少(圖3)。
圖2 馬祖浮標觀測1月(上圖)和7月(中圖)海面風玫瑰圖(下圖為圖例)
圖3 台灣及周邊島嶼1月(上圖)和7月(下圖)月降雨量(單位:mm)
參考文獻
編輯數據引用格式
編輯韓玉康, 趙艷玲. 台灣及周邊島嶼氣象水文觀測數據集[DB/OL]. Science Data Bank, 2020. (2020-04-07). DOI: 10.11922/sciencedb.972.