2018成都洪澇災害多源時空數據集

2018成都洪澇災害多源時空數據集
作者:李振宇 解吉波 楊騰飛 牟乃夏
2019年3月18日
本作品收錄於《中國科學數據
李振宇, 解吉波, 楊騰飛, 牟乃夏. 2018成都洪澇災害多源時空數據集[J/OL]. 中國科學數據, 2018. (2019-02-27). DOI: 10.11922/csdata.2018.0093.zh.


摘要&關鍵詞 編輯

摘要:隨着防災、減災與救災技術的不斷進步,有效的涉災數據來源也愈廣泛。在洪澇事件中,傳統的遙感影像、地面GIS數據以及社會經濟發展狀況作為主要災害數據來源已得到一致認可,同時作為「移動傳感器」的新興災害數據——社交媒體數據以其廣泛的參與性和多源的傳播性也得到了廣泛的應用。本文以2018年7月成都洪澇事件為研究對象,基於多源時空數據融合的理念,收集整理了洪澇事件中不同時期的河流情況、遙感影像、新浪微博數據以及該區域的地形條件與社會經濟發展狀況數據。在傳統災害數據的基礎上,結合災區公眾視角,較為完整地展現了此次洪澇災害的影響程度與災情進展,為後續的洪澇災害風險區域劃分、淹沒範圍建模以及災情評估提供完整有效的數據支持。

關鍵詞:洪澇災害;社交媒體;GIS;多源時空數據

Abstract & Keywords 編輯

Abstract: With the continuous development of disaster prevention, mitigation and relief means, disaster-related data are becoming increasingly effective and extensive. In flood events, traditional remote sensing images, terrestrial GIS data, and socio-economic development data are widely recognized as the major sources of disaster data. In the meantime, social media data emerged as a "mobile sensor" of disasters, which have been widely used for its extensive participation and multi-source dissemination. Based on the concept of multi-source spatiotemporal data fusion, this paper collects and collates river situation data, remote sensing images, Sina Weibo data, terrain condition and socio-economic development data of the region in different periods in the flood event. On the basis of traditional disaster data, this study engages a public perspective of the disaster area to show the impact of flood disaster and the progress of the disaster, which provides complete and effective data support for subsequent flood risk zoning, flooding range modeling and disaster assessment.

Keywords: flood disaster; social media; GIS; multi-source spatiotemporal data

數據庫(集)基本信息簡介 編輯

數據庫(集)名稱 2018成都洪澇災害多源時空數據集
數據作者 李振宇,解吉波,楊騰飛,牟乃夏
數據通信作者 牟乃夏(mounaixia@163.com)
數據時間範圍 2015年、2016年、2018年7月
地理區域 地理範圍為東經104°07′,北緯30°67′,中國四川省成都市
數據量 5.79 GB
數據格式 ESRI Shapefile、ESRI GRID、TIF
數據服務系統網址 http://www.sciencedb.cn/dataSet/handle/712
基金項目 國家重點研發項目(2016YFA0600302)
數據庫(集)組成 數據集由7部分數據組成:其一為2018年7月成都市哨兵遙感影像數據,數據為TIF格式,存儲於sentinel.rar壓縮包中;其二是2018年7月成都市新浪微博數據,數據為Shapefile格式,存儲於weibo. rar壓縮包中;其三是成都市數字高程模型數據,數據為TIF格式,存儲於dem. rar壓縮包中;其四2015年成都市土地利用數據,數據為IMG格式,存儲於land_use. rar壓縮包中;其五是2018年7月成都市各區(市)縣降雨量數據,數據為Shapefile格式,存儲於precipitation. rar壓縮包中;其六是2018年7月成都市河流水情數據,數據為Shapefile格式,存儲於river. rar壓縮包中;其七是2016年成都市各區(市)縣社會發展情況數據,數據為Shapefile格式,存儲於social_development. rar壓縮包中。

Dataset Profile 編輯

Title A multi-source spatiotemporal dataset of floods in Chengdu (2018)
Data corresponding author Mou Naixia (mounaixia@163.com)
Data authors Li Zhenyu, Xie Jibo,Yang Tengfei,Mou Naixia
Time range 2015, 2016, July 2017
Geographical scope 104°07′ east longitude, 30°67′ north latitude, Chengdu, Sichuan, China
Data volume 5.79 GB
Data format ESRI Shapefile, ESRI GRID, TIF
Data service system http://www.sciencedb.cn/dataSet/handle/712
Sources of funding National Key Research and Development Program of China (2016YFA0600302)
Dataset composition This dataset consists of seven parts of data, including: July 2018 Chengdu sentinel remote sensing image data in TIF format, stored as sentinel.rar; July 2018 Chengdu Sina-Weibo data in shapefile format, stored as weibo.rar; Chengdu digital elevation model data in TIF format, stored as dem.rar; Chengdu land use data in IMG format, stored as land_use.rar; July 2018 Chengdu district (city/county) rainfall data, in shapefile format, stored as precipitation.rar; July 2018 Chengdu river water data in shapefile format, stored as rivers.rar; 2016 Chengdu district (city/county) social development situation data in shapefile format, stored as social_development.rar.


引 言 編輯

洪澇災害是最頻發的自然災害,嚴重影響國民經濟發展、危害人民生命財產安全、破壞環境[1],快速有效地防災、減災與救災至關重要。隨着洪澇災害的預防、減輕與救援技術的不斷革新與改進,有效的涉災數據也越發多元化。洪澇災害的產生與影響涉及多種因素,單一尺度數據在複雜的災害背景下往往是不夠的。因此,多源涉災數據的融合使用能更好地服務於減災部門的防災、減災與救災。受災區域的風險劃分對於洪澇災害的預防有重要的意義,對此已有許多學者開展了研究,提出與建立了多種評估模型。如周成虎[2]、趙霞[3]、蔣新宇[4]、馬國斌[5]等利用降雨、河網、地形、社會發展情況等多源數據建立了洪澇災害權重指數模型對洪澇災害危險性進行評價,同時給出定量化的分級評價結果;在災情的實時檢測中,多源數據融合也同樣能發揮重要的作用,如Rosser使用遙感影像、地形數據以及災區用戶的Flickr數據實現洪澇範圍的快速預測[6],Eilander等人也使用Twitter與數字高程模型(Digital Elevation Model,DEM)相結合生成實時的洪澇災害地圖[7],實現對洪澇淹沒範圍的計算;同時許多學者利用與災害相關的tweets(用戶發到Twitter上的信息)獲取洪澇災害造成的社會影響[8][9]與洪水時間行為[10],通過挖掘社交媒體中蘊含的涉災信息進行災情評定與分析。相關的研究都表明包括社交媒體在內的多源數據的結合能夠更加完整有效地為相關部門的災害預防、災情評估與災後救援提供數據支持。

2018年7月受強降雨影響,四川遭受50年不遇的特大洪災,多條河流出現超警戒與超保護水位,造成多地受災損失慘重。其中成都市是受影響最嚴重的城市之一,在7月2日、9–11日、14–16日、15–17日、19–21日城市發生共5次洪澇災害,嚴重影響市民的生產生活並造成巨大的經濟損失。考慮到洪澇災害對城市的持續性破壞以及災害前中後的不同變化,本文收集整理了2018年7月成都市遙感影像數據、社交媒體數據、各區(市)縣降雨量數據與河流水情數據,成都市DEM數據、土地利用數據、各區(市)縣人口、各區(市)縣生產總值以及各區(市)縣農業面積占比等,建立了2018年成都洪澇多源時空數據集,在傳統災害數據的基礎上,結合災區受災人群視角,完整展現此次洪澇災害影響與災情進展,為研究分析成都洪水災情、建立洪澇災害模型提供數據基礎。其中由於在洪水期間陰雨天氣持續時間較長,雲量大,光學遙感衛星在監測時會被長時間遮擋,無法觀測到大面積下墊面實際情況,而哨兵1號衛星(Sentinel-1)能提供高分辨的雷達影像,在洪水期間可為汛期監測、淹沒範圍評估等都能提供重要的數據支持,新浪微博數據則以其廣大的用戶量以及鮮明的時空特徵成為了主要的社交媒體災害數據,故遙感影像與社交媒體分別選擇使用哨兵Sentinel-1A衛星地距影像(GED,Ground Range Delected)與新浪微博數據。

1 數據採集和處理方法 編輯

數據的採集與處理流程主要包括3個步驟:原始數據收集、數據預處理、數據後處理具體細節如圖1所示。


圖片

圖1 數據採集與處理


1.1 原始數據收集 編輯

本研究數據主要分為四大類:第一類是基礎地理數據,包括遙感影像、數字高程模型、土地利用數據與原始矢量數據(行政區劃、河流)。第二類為水文數據,包括各區(市)縣降雨量數據以及成都市河流水況數據。第三類為社會發展狀況數據,包括各區(市)縣人口密度數據、人均生產總值數據與農業面積占比。第四類是社交媒體數據,即新浪微博數據。

(1)基礎地理數據。遙感影像數據主要通過歐洲航天局所屬的影像數據下載網站(https://scihub.copernicus.eu/dhus/#/home)下载,共收集7月1日、8日、13日、20日以及25日5幅哨兵1的雷达影像数据,原始遥感影像如图2所示;通过地理空间数据云(http://www.gscloud.cn/)收集了成都市的SRTM(Shuttle Radar Topography Mission)90米分辨率高程數據;土地利用數據則是來自與資源環境數據云平台(http://www.resdc.cn/data.aspx?DATAID=184)的1千米的栅格数据;而原始矢量数据则通过全国地理信息资源目录系统(http://www.webmap.cn/main.do?method=index)进行收集。


圖片

圖2 原始遙感影像


(2)水文數據。河流水況數據與降雨量數據通過四川省水文水資源勘測局官方網站(http://www.schwr.com/swcb/swyb/2018-08-02/2333.html)发布的“四川省18年7月水情实况”与成都市气象局(http://www.cdtq.gov.cn/)发布的天气实况进行收集,原始数据如图3、图4所示。


圖片

圖3 河流原始數據(其中各水位單位為米;各流量單位為立方米/秒)


圖片

圖4 成都市降雨量原始數據(單位為毫米)


(3) 社會發展狀況數據。根據成都市統計局官方網站(http://www.cdstats.chengdu.gov.cn/)发布的《成都統計年鑑2017·區(市)縣》進行採集處理。

(4) 社交媒體數據。原始數據如圖5所示,新浪微博數據收集自2018年7月1日至2018年7月31日新浪微博平台用戶發送的涉災信息。對於新浪微博的數據,利用該平台的高級搜索功能來獲取。為確保數據的相關性,以「洪水」「暴雨」「淹、水」「水災」「漲、水」(詞組中頓號為單個字同時檢索,即搜索結構文本中同時包含)為關鍵詞,將時間段設為2018年7月1日0時至2018年7月31日的23時,地點則設置為四川省成都市。


圖片

圖5 新浪微博原始數據


1.2 數據預處理 編輯

1.2.1 基礎地理數據與水文數據 編輯

遙感技術的發展為洪澇災害的客觀、大面積的監測供了有效的手段。為最大限度消除觀測值和觀測物體的光譜反射率或輻射亮度值的差異,首先需要對哨兵的雷達影像進行輻射校正,其次為了抑制噪聲對影像解譯的影響,對其進行斑點噪聲抑制,同時由於雷達圖像的成像問題,往往會造成影像的失真,需要對影像進行幾何地形校正,其中由於GRD影像已進行了多視與地理編碼校正處理,無需再進行配准處理,最後轉換為TIF格式並進行裁剪。DEM數據、土體利用數據、河流水況數據以及降雨量數據等不僅是洪澇危險區域劃分重要的自然因素,也是災情實時檢測與災後影響評估的重要參數,其下載平台所提供的原始地理數據通常以圖幅的形式保存。本文針對成都市的洪澇災害篩選出相關的數據,在對其實現統一坐標轉換後進行裁剪與要素融合。針對降雨量數據,因成都市氣象局發布的是圖片信息,在後續地理分析中需轉換成定量化的地理數據,所以在數據預處理階段需要對其每個區域每天的降雨量進行統計,其中錦江區、青羊區、武侯區、成華區、金牛區統稱為主城區。而針對河流的預處理主要是查詢成都境內的主要河流與支流信息,並對照「四川省2018年7月水情實況」篩選出成都境內河流7月的洪水情況,進而按照天數進行統計。

1.2.2 社會發展狀況數據與社交媒體數據 編輯

社會發展狀況是劃分風險區域與評估災情的重要指標,通常認為社會發展狀況可以定性反映區域的災損敏感度,在遭受同等級的洪澇時,經濟發達且人口密集的區域往往承受更大的損失,同時地區農業在洪澇災害中災損敏感度最高。本文通過統計年鑑篩選成都各區(市)縣的人口密度、人均生產總值以及農業占比,綜合社會發展的因素,通過式(1)計算各地區災損敏感度\({D}_{i}\)。

\({D}_{i}=\frac{{G}_{i}}{\sum _{i=0}^{k}{G}_{i}}+\frac{{P}_{i}}{\sum _{i=0}^{k}{P}_{i}}+\frac{{A}_{i}}{\sum _{i=0}^{k}{A}_{i}}      (1\) )

式中i表示所屬地區對應的下標,\({G}_{i}\)表示地區人均生產總值,\({P}_{i}\)表示地區人口密度,\({A}_{i}\)表示地區農業面積占比。

新浪微博數據中蘊含豐富的災害信息,無論是博文本身所涉及災損信息與社會影響還是用戶上傳的時間信息與地理位置都能很好地服務於災害的檢測與評估。新浪微博採集的原始數據為HTML網頁,其信息雜亂且無結構化,通過頁面中的不同元素與父子節點關係解析原始頁面並對進行清洗與結構化,最終獲取博文信息、上次時間、地理位置、圖片鏈接、該博文的點讚數、轉發數以及評論數等相關信息。考慮到同一用戶發送同一博文與多個關鍵詞的檢索時出現的重複數據,在數據入庫時設置聯合索引對數據進行去重處理。

1.3 數據後處理 編輯

統計數據矢量化。不同的統計數據對應到不同的地理實體中,如各區(市)縣的人口數量、生產總值、降雨量等信息,根據不同的行政區劃。同樣的,河網水情數據也根據對應的河流網絡進行屬性信息的錄入,最後實現統計數據的矢量化。

新浪微博數據矢量化。主要分為3個步驟:位置篩選、地名地址轉換、轉至矢量點。基於公眾使用微博的習慣,並不是所有人都會上傳微博位置信息,所以首先篩選出攜帶地理屬性信息的博文,其次考慮到其地理屬性信息為定性化的自然地理位置屬性如「成都 · 大彎街區」,需將其轉化為可展示的定量化地理坐標信息,對此本文採用百度地圖開放平台提供的坐標轉換服務(http://lbsyun.baidu.com/index.php?title=webapi/guide/changeposition)实现地名地址转换。需要注意的是,出于安全考虑,国内必须使用国测局制定的GCJ-02坐标系(火星坐标系)对地理位置进行加密,所以转换完后的坐标系为GCJ-02坐标系。虽经纬度数值与真实坐标有所偏差,但在大面积估算分析中并未存在影响。最后将信息导入ArcGIS中转换为矢量坐标点,相关的属性信息一并存储于属性表中。

2 數據樣本描述 編輯

本數據集涵蓋與研究成都市洪澇災害相關的各類數據,包括影像、DEM、土地利用、河流水況、降雨量、社會發展以及新浪微博數據等,各數據的樣例如表1所示。其中河流水況、降雨量、社會發展以及新浪微博數據通過矢量化的方式轉化為Shapfile格式的矢量數據,其相關屬性存儲於該數據的屬性表中,如表2–5所示。


表1 各數據樣例表

數據類型 數據格式 詳細描述 樣例
影像數據 TIF 10米分辨率 圖片
DEM數據 TIF 90米分辨率 圖片
土地利用數據 GRID 1000米分辨率 11為水田,12為旱地,21為有林地,22為灌木林,23為疏林地,24為替他林地,31為高覆蓋度草地,32為中覆蓋度草地,33為低覆蓋度草地,41為河渠,42為湖泊,43為水庫坑塘,46為灘地,51為城鎮用地,52為農村居民點,53為其它建設用地,65為裸土地,66為裸岩石質地。 圖片
河流水況數據 Shapfile 字段「NAME」為各河流名,字段「WL」表示河流水位,單位為米;字段「Flow」表示河流流量,單位為立方米/秒;「OWWL」表示河流超警水位,單位為米;「OPWL」表示河流超保水位單位為米,「RP」表示河流重現期,「OWF」表示河流超警流量,各字段前綴表示日期。 圖片
降雨量數據 Shapfile 字段「NAME」表示區(市)縣名字,各時間字段表示當天的降雨量,單位為毫米 圖片
社會發展狀況數據 Shapfile 字段「NAME」表示區(市)縣名字;字段「POP_DEN」表示地區人口密度,單位為人/平方公里;字段「GDP」表示地區人均生產總值,單位為萬元/人;字段「AGR_AREA」表示地區農業占比 圖片
新浪微博數據 Shapfile 字段「keyword」表示檢索的關鍵字;字段「city」表示數據所處的城市;字段「content」表示博文的內容;字段「location」表示定位的自然地理位置;字段「picture」表示圖片鏈接;字段「time」表示發布時間;字段「forwarding_number」表示該博文轉發數;字段「comments」表示該博文的評論數;字段「likes」表示該博文的點讚數;字段「lat」與「lng」分別表示轉換後的經緯度 圖片


表2 河流水況屬性表示例

FID 8
Shape 折線
NAME 沱江
7_2_WL
7_2_Flow
7_11_WL 447.74
7_11_Flow 7810
7_11_OWWL 4.44
7_11_WPWL 2.64
7_11_RP 50


表3 社會經濟發展屬性表示例

FID 0
Shape
NAME 浦江縣
GDP 4.4
POP_DEN 462
AGR_AREA 0.41


表4 降雨量表示例

FID 0
Shape
NAME 浦江縣
7_1 25.8
7_2 316.9
7_3 1.4
7_31 58


表5 新浪微博屬性表示例

FID 40
Shape
keyword 漲、水
province 四川
city 成都
content #成都暴雨# #金堂暴雨# 金堂現在 漲 水 的最新情況,已經停 水 停電了,小區也 漲 水 了…
location 成都 · 趙鎮
picture http://wx2.sinaimg.cn/orj480/e686f2bely1ft5y1heealj20qo0f4dh2.jpg;
time 07月11日 14:22
forwarding_number 3
comments
likes
lat 30.859652
lng 104.44062


3 數據質量控制和評估 編輯

基礎地理數據與水文數據。STRM 90米分辨率DEM數據的值域範圍為−152~8806米之間,水平精度20米,高程精度16米。原始的矢量數據在與附近野外控制點的平面位置的最小最大誤差為50米與200米,數據精度可滿足大範圍分析需求。通過在ArcGIS中加載天地圖的在線地圖服務對其進行校準,實現矢量數據的質量把控。土地利用數據則是基於Landsat 8 遙感影像,通過人工目視解譯生成,質量精度較高,通過對比高分衛星影像數據進行質量控制。降雨量信息與河流水情信息皆來自相關官方網站,數據的可信度與準確性都較高,在此基礎上再進行多方來源的此類型數據對比查驗,實現對數據的質量把控。

社交媒體數據,作為災情評估與分析的重要數據來源,其文本內容的有效性與位置的準確性都十分重要。一方面為確保數據的完整性與相關性,本文人工檢查了所有微博數據,刪除與主題無關或不完整的數據。另一方面,在坐標轉換過程中由於地理描述信息的精度與地理坐標的加密,轉換後的地理坐標會出現誤差,雖然在大面積分析中允許誤差出現,但誤差範圍必須符合人們的常規認識,本文通過將坐標依次輸入百度地圖在線經緯度拾取工具(http://api.map.baidu.com/lbsapi/getpoint/index.html)与数据中地名地址对比,将误差较大的数据去除,以此实现数据质量的控制。

最後通過不同數據圖層的疊加(圖6),實現交叉驗證數據質量。


圖片

圖6 數據疊加


4 數據使用方法和建議 編輯

數據集收集了洪澇災害的多源數據,數據格式包括TIF、GRID、Shapfile,使用主流的GIS軟件均可實現讀寫。針對數據集的使用有以下幾點建議:

(1)洪澇風險區域劃分。通過各涉災因子建立不同的指標並進行地圖代數處理,然後進行疊加分析並劃分綜合風險區域,最後再利用遙感影像與社交媒體數據進行評估結果的驗證。

(2)洪澇淹沒範圍檢測建模。對遙感影像採用不同的算法進行淹沒範圍的提取,結合社交媒體中蘊含的水位信息、地形變化、流域水情以及降雨量建立完善的洪澇淹沒範圍模型。

(3)洪澇災情評估建模。新浪微博無論是博文信息還是圖片信息中都蘊含了不同的災損信息與社會影響信息,如洪澇災害造成的交通堵塞、農林作物損毀、人員傷亡、水電影響以及房屋水浸等,此類信息對災害的評估有重要的作用,通過抽取其中的相關信息結合土地利用數據與社會發展狀況實現對災情的評估,細粒度地分析易發生的災害損失區域,為以後相關部門的針對性救災決策提供支持。

參考文獻 編輯

  1. 劉亞嵐, 王世新, 閻守邕, 等. 遙感與GIS支持下的基於網絡的洪澇災害監測評估系統關鍵技術研究[J]. 遙感學報, 2001, 5(1): 53-57.
  2. 周成虎,萬慶,黃詩峰,等. 基於GIS的洪水災害風險區劃 研究[J]. 地理學報, 2000, 55(1): 15-24.
  3. 趙霞, 王平, 龔亞麗, 等. 基於GIS的內蒙古中部區域洪水 災害風險評價[J]. 北京師範大學學報(自然科學版), 2007, 43( 6): 666–669.
  4. 蔣新宇, 范久波, 張繼權, 等. 基於GIS的松花江幹流暴雨洪澇災害風險評估[J]. 災害學, 2009, 24(3): 51–56.
  5. 馬國斌, 李京, 蔣衛國, 等 . 基於氣象預測數據的中國洪澇災害危險性評估與預警研究[J]. 災害學, 2011, 26(3): 8–12,17.
  6. ROSSER J F, LEIBOVICI D G, JACKSON M J. Rapid flood inundation mapping using social media, remote sensing and topographic data[J]. Natural Hazards, 2017, 87(1): 103-120.
  7. EILANDER D , TRAMBAUER P , WAGEMAKER J, et al. Harvesting Social Media for Generation of Near Real-time Flood Maps[J]. Procedia Engineering, 2016, 154: 176-183.
  8. GUAN X, CHEN C. Using social media data to understand and assess disasters[J]. Natural Hazards, 2014, 74(2):837-850.
  9. LU X, BRELSFORD C. Network Structure and Community Evolution on Twitter: Human Behavior Change in Response to the 2011 Japanese Earthquake and Tsunami [J]. Scientific Reports, 2015, 4(1): 6773.
  10. SCHNEBELE E, CERVONE G, WATERS N. Road assessment after flood events using non-authoritative data[J]. Natural Hazards & Earth System Sciences, 2014, 14: 1007-1015.

數據引用格式 編輯

李振宇, 解吉波, 楊騰飛, 牟乃夏. 2018成都洪澇災害多源時空數據集[J/OL]. 中國科學數據, 2018. (2018-12-14). DOI: 10.11922/sciencedb.712.


 

本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse