台湾及周边岛屿气象水文观测数据集

台湾及周边岛屿气象水文观测数据集
作者:韩玉康 赵艳玲 关吉平 申晓莹 陈飞
2020年4月22日
本作品收錄於《中国科学数据
韩玉康, 赵艳玲. 台湾及周边岛屿气象水文观测数据集[J/OL]. 中国科学数据, 2020. (2020-04-20). DOI: 10.11922/csdata.2020.0017.zh.


摘要&关键词

编辑

摘要:气象水文数据是开展气象水文预报预测、科学研究、开发利用和工程建设的基础,是气象水文科学发展的原动力。台湾及其周边岛屿地理位置和战略位置十分重要,并具有独特的气候水文环境和变化特点,而国内在该地区的气象水文观测资料稀缺。通过Python网络爬虫技术,从互联网自动、定时收集下载台湾气象局网页公布的气象水文公共服务信息数据,对原始数据进行处理、加工和标准化格式存储,制作了标准规范的台湾及周边岛屿的气象水文观测数据集,总大小2.0 MB,包括金门浮标、马祖浮标等16个海洋环境观测浮标的气温、风、有效波高等8个气象水文要素的日平均数据,时间范围2015–2019年,共16个数据表格1.5 MB;台北、新竹等26个气象观测站的降水月平均资料,时间范围2010–2018年,共26个数据表格500 KB。为台湾及周边岛屿的气象水文科学研究提供数据基础支撑。

关键词:台湾;岛屿;气象水文;观测数据

Abstract & Keywords

编辑

Abstract: Meteorological and hydrological data is the foundation of meteorological and hydrological prediction, scientific research, development and utilization, and engineering construction, and the driving force of the development of meteorological and hydrological science. The geographical position and strategic position of Taiwan and its surrounding islands are very important, and they have unique climatic and hydrological environment and change characteristics, while the meteorological and hydrological observation data in this area are scarce in China. Through Python web crawler technology, collect and download the meteorological and hydrological public service information data published on the web page of Taiwan Meteorological Administration from the Internet automatically and regularly, process and store the original data in a standardized format, and make a standardized meteorological and hydrological observation dataset of Taiwan and its surrounding islands, with a total size of 2.0 MB, including the daily average data of 8 Meteorological and hydrological elements such as temperature, wind and effective wave height of 16 ocean environment observation buoys such as Jinmen buoy and Mazu buoy, with a time range of 2015–2019, a total of 16 data tables of 1.5 MB; the monthly average precipitation data of 26 meteorological observation stations such as Taipei and hsinchu, with a time range of 2010–2018, with a total of 26 data tables of 500 KB. It provides data base support for meteorological and hydrological research in Taiwan and its surrounding islands.

Keywords: Taiwan; island; meteorology and hydrology; observation data

数据库(集)基本信息简介

编辑
数据库(集)名称 台湾及周边岛屿气象水文观测数据集
数据作者 韩玉康、赵艳玲、关吉平、申晓莹、陈飞
数据通信作者 关吉平(yukang_han@163.com)
数据时间范围 海洋浮标观测数据:2015年8月1日至2019年6月30日 气象观测站降雨资料:2010年1月1日至2018年12月30日
地理区域 台湾及周边岛屿
数据量 2.0 MB
数据格式 *.xlsx
数据服务系统网址 http://www.sciencedb.cn/dataSet/handle/972
数据库(集)组成 本数据集包括两部分内容:一是金门、马祖、澎湖、东沙岛、鹅銮鼻、富贵角、龟山岛、花莲、琉球屿、龙洞、弥陀、七股、七美、苏澳、台东、新竹共16个海洋气象水文观测浮标的2015–2019年的日平均数据,共16个数据表组成,总大小1.5 MB,包含气温、气压、表层水温、风速、风向、瞬时风速、有效波高、流速8个气象水文要素。二是金门、马祖、澎湖、阿里山、鞍部、大武、淡水、东吉屿、高雄、恒春、花莲、基隆、嘉义、兰屿、彭佳屿、日月潭、苏澳、台北、台东、台南、台中、梧栖、新竹、宜兰、玉山、竹子湖26个气象观测站降雨的月平均数据,共26个数据表组成,总大小500 KB,包括月降雨量、月降雨日数、最大日降雨量3个要素。

Dataset Profile

编辑
Title A meteorological and hydrological observation dataset of Taiwan and its surrounding islands
Data corresponding author Guan Jiping
Data authors Han Yukang, Zhao Yanling, Guan Jiping, Shen Xiaoying, Chen Fei
Time range Ocean buoy observation data: August 1, 2015 to June 30, 2019; Rainfall data of meteorological observation station: January 1, 2010 to December 30, 2018
Geographical scope Taiwan and its surrounding islands
Data volume 2.0 MB
Data format *.xlsx
Data service system < http://www.sciencedb.cn/dataSet/handle/972>
Dataset composition This data set includes two parts: one is the daily average data of 16 marine meteorological and hydrological observation buoys in 2015-2019, consisting of 16 data tables, with a total size of 1.5 MB, including 8 Meteorological and hydrological elements, i.e. air temperature, air pressure, surface water temperature, wind speed, wind direction, instantaneous wind speed, effective wave height and velocity. The second is the monthly average rainfall data of 26 meteorological observation stations in Jinmen, Mazu, Penghu, Alishan, Anshan, Dawu, Danshui, dongjiyu, Kaohsiung, Hengchun, Hualian, Keelung, Jiayi, Lanyu, pengjiayu, Riyuetan, su'ao, Taibei, Taidong, Tainan, Taichung, Wuqi, Xinzhu, Yilan, Yushan and Zhuhu, with a total size of 500 KB, including monthly rainfall, monthly rainfall days and maximum daily rainfall.


引 言

编辑

气象水文数据是开展气象水文预报预测、科学研究、开发利用和工程建设的基础,是气象水文科学发展的原动力[1],在研究气候变化、增强气象水文预报保障能力、开发利用气象水文环境资源、陆地和海洋工程建设和国民经济、**等方面具有十分重要的意义。

台湾及周边岛屿位于东亚沿岸,背靠欧亚大陆,东临太平洋,是连接太平洋和南海、印度洋的重要地理和战略位置,主要包括台湾岛以及金门、马祖、澎湖列岛、琉球屿、东沙岛等台湾“离外岛”,海洋观测浮标和气象观测站位置如图1。因地理位置和地形特殊,台湾及其周边岛屿具有独特的气候水文环境和变化特点,也是气象海洋学家关注的重点[2][3]。收集整编台湾及周边岛屿的气象水文观测资料,对于其气象水文环境科学研究和实际利用具有较为重要的价值和意义。


图片

图片

图1 海洋浮标位置(上图)和气象观测站位置(下图)


目前国内还未见台湾及周边岛屿的气象水文数据公开发表,互联网公布的气象水文观测信息通过服务信息形式发布,定期更新,只存留一定时间。鉴于此,本文通过Python网络爬虫技术,从互联网自动、定时收集下载台湾气象局网页公布的气象水文公共服务信息数据,对原始数据进行处理、加工和标准化格式存储,制作了标准规范的台湾及周边岛屿的气象水文观测数据集,便于读取和使用,以期为气象水文科学研究提供数据基础支撑。

1 数据采集和处理方法

编辑

1.1 数据源

编辑

本研究数据来源台湾气象局公布的气象水文服务信息,通过Python网络爬虫技术,定时、自动下载。其中,海洋浮标观测资料自2015年8月1日开始,累积至2019年6月30日,为每小时1次,为每天24次,均为气象海洋环境浮标所载观测仪器自动观测所得。原始数据网页保存30天,逐日更新、递推,过期无法下载获取;气象观测站降雨资料为逐日资料,为雨量自动观测仪观测所得,包含日降雨量1个要素,时间范围2010–2018年,每日更新数据。

1.2 数据收集与处理

编辑

首先利用Python网络爬虫技术,进行相关网页的数据自动、定时爬取,存储至本地数据库,解决了互联网数据零散、下载复杂、人工定时下载难度大的问题。对于收集的原始数据,利用Matlab语言编程进行数据处理加工,求取各要素日平均值、月平均值和其他特征量值,形成日平均和月平均数据,以相对标准、实用的数据形式存储为新的表格型数据(xlsx)格式,统一规范命名。

2 数据样本描述

编辑

2.1 数据集结构

编辑

本数据集包括两部分内容,总大小2.0 MB:一是金门等16个海洋环境浮标的2015–2019年的气象水文要素的日平均数据,共16个数据表组成,大小1.5 MB,包含气温、风等8个气象水文要素;二是台北等26个气象观测站降雨的月平均数据,共26个数据表组成,大小500 KB。具体数据集组成如表1。


表1 数据集组成

数据名称 要素种类 观测站 '数据格式'数据量 '数据'类型
气象水文浮标观测数据集 气温、气压、表层水温、风速、风向、瞬时风速、有效波高、流速 金门、马祖、澎湖、东沙岛、鹅銮鼻、富贵角、龟山岛、花莲、琉球屿、龙洞、弥陀、七股、七美、苏澳、台东、新竹 表格型xlsx1.5 MB 日平均
降雨数据集 月降雨量、月降雨日数、最大日降雨量 金门、马祖、澎湖、阿里山、鞍部、大武、淡水、东吉屿、高雄、恒春、花莲、基隆、嘉义、兰屿、彭佳屿、日月潭、苏澳、台北、台东、台南、台中、梧栖、新竹、宜兰、玉山、竹子湖 表格型xlsx500 KB 月平均


2.2 数据属性表

编辑

各浮标气象水文观测数据表和各气象观测站降雨数据表均包括测站信息、观测时间和要素数值三部分内容,数据表中的字段名称、量纲、数据类型、数据样例等信息具体如表2和表3。


表2 各浮标观测气象水文数据表内容

表内容序号 字段名称 量纲 数据类型 数据样例
1 测站名称 - 文本型 金门浮标
2 测站经度 °E 数值型 118.41
3 测站纬度 °N 数值型 24.38
4 - 数值型 2019
5 - 数值型 6
6 - 数值型 30
7 气温 数值型 28.4
8 气压 hPa 数值型 1002.1
9 表层水温 数值型 29.6
10 风速 m/s 数值型 4.5
11 风向 ° 数值型 193.6
12 瞬时风速 m/s 数值型 5.8
13 有效波高 m 数值型 0.8
14 流速 cm/s 数值型 26.7


表3 各气象观测站降雨数据表内容

表内容序号 字段名称 量纲 数据类型 数据样例
1 测站名称 - 文本型 阿里山
2 测站经度 °E 数值型 120.8
3 测站纬度 °N 数值型 23.52
4 - 数值型 2010
5 - 数值型 1
6 月降雨量 mm 数值型 52.7
7 月降雨日数 d 数值型 8
8 最大日降雨量 mm 数值型 22


3 数据质量控制和评估

编辑

本数据集原始数据均为气象水文自动观测平台观测所得,观测仪器定期检测和维护保养,保证观测的准确性。互联网收集的气象水文服务信息,在发布前,均已通过多种数据质量控制方法,进行过严格的质量控制,剔除异常值和错误值,数据真实、可信。在本数据集处理、制作过程中,严格处理流程和规范操作,各类气象水文要素特征量的计算方法科学,再次对数据的完整性、准确性进行检查,确保数据处理、存储过程科学、严谨,保证数据质量。

数据观测过程中由于仪器缺测、剔除异常值、错误值等原因,存在部分无记录资料,在计算要素的日平均值时,若某个要素该日的观测次数不足12次,则本要素该日的均值不做计算,记作空值(以“99999”表示);在计算某个要素的月平均值时,若某个要素该月的观测有效日数少于5日(1侯),则该月的均值不做计算,记作空值(以“99999”表示),以避免由于数据量过少导致的均值计算存在偏差。

4 数据价值

编辑

本数据集收集整编了台湾及周边岛屿的浮标观测的气象水文资料和气象观测站的降水资料,处理加工,形成了格式统一规范的日平均的气象水文浮标观测数据集和降水数据集,填补了国内在台湾及周边岛屿地区的气象水文观测资料的严重缺乏,有利于我们更好的开展该地区的气象水文环境研究,加强了解认识,为实际利用打下良好基础。

例如我们分析了马祖浮标观测的1月份和7月份海面风场特点,可以看出,1月风向以东北风为主,最大概率风向为NE,占48.9%,次大概率风向为NNE占21.47%,1月风速整体大于7月,1月平均风速7.1 m/s,6级以上大风概率11%,7月平均风速4.9 m/s,6级以上大风只占1%(图2)。分析了台湾及周边岛屿1月和7月的降雨特点,可以看出,1月和7月的降雨量在量级和地区分布均有较大差别:1月降雨量呈东北高、西南低、自东北向西南递减的特点,东北部位于东北季风迎风坡,最大降雨量苏澳气象站观测362.8 mm,西南部位于背风坡,降水量少,多各测站观测在20 mm以下;7月受夏季风和热带气旋影响显著,降雨充沛,降雨量中部山区最多,阿里山气象站观测可达668.3 mm,其次是西南地区,北部地区降雨量最少(图3)。


图片

图片

图片

图2 马祖浮标观测1月(上图)和7月(中图)海面风玫瑰图(下图为图例)


图片

图片

图3 台湾及周边岛屿1月(上图)和7月(下图)月降雨量(单位:mm)


参考文献

编辑
  1. 李猛, 胡波, 韩晓增, 等. 2009–2018年中国科学院海伦农业生态实验站气象数据集[J]. 中国科学数据, 2020, 5(1). DOI: 10.11922/csdata.2019.0034.zh.
  2. 龚立新, 韩玉康, 赵艳玲, 等. 中国台湾降雨特征分析[J]. **气象水文,2019, 4: 43-47.
  3. 郑崇伟, 陈璇, 李崇银. 台湾岛周边海域的波候观测[J]. **理工大学学报(自然科学版), 2016, 17(5): 473-479.

数据引用格式

编辑

韩玉康, 赵艳玲. 台湾及周边岛屿气象水文观测数据集[DB/OL]. Science Data Bank, 2020. (2020-04-07). DOI: 10.11922/sciencedb.972.


 

本作品在“知识共享-署名 4.0 国际”协议下发表。

Public domainPublic domainfalsefalse