鎳基高溫合金材料數據集
鎳基高溫合金材料數據集 作者:尹海清 徐斌 姜雪 張聰 張瑞傑 劉國權 曲選輝 2019年3月29日 |
|
摘要&關鍵詞
編輯摘要:高溫合金材料是製備飛機發動機葉片的材料,是推動國家航空航天發展的關鍵。國內高溫合金髮展存在瓶頸,然而國外高溫合金數據保密性高,高溫合金信息獲取相對困難。國內高溫合金數據的收集工作起步晚,且大部分關鍵數據都保存在企業中,不對外公開,導致開放共享的高溫合金數據庫較少,一定程度上制約了我國高溫合金的研究。本數據集基於1980–2016年期間國際高溫合金大會會議的論文集(International Symposium on Superalloys),採用人工閱讀、像素點數值轉化的方法,記錄材料牌號與名稱、材料成分、原材料信息、性能信息、實驗條件等數據,從數據來源、數據審核人和數據誤差率3個方面對數據質量進行控制和評價。並且,來自同一篇文章的數據擁有唯一的DOI標識。本數據集的研製對實現材料數據的知識產權保護與共享、對我國高溫合金的發展都將起促進作用,同時滿足了數據驅動的材料設計這一新型研究方式的需求。
關鍵詞:高溫合金;高溫合金數據集;國際高溫合金大會會議論文集;數據公開
Abstract & Keywords
編輯Abstract: Superalloy is a crucial material for the development of aerospace industries. However, Due to high confidentiality imposed on superalloy data exchange abroad, acquisition of superalloy data has been relatively difficult. Domestic collection of superalloy data starts much later than and the databases are often not for open access, which to some extent restricts the development of superalloy research. Based on the International Symposium on Superalloys from 1980 to 2016, this study collects such information as materials grade and brand name, chemical composition, raw materials information, performance, processing and characterization conditions, by means of manual recording and pixel value conversion. Data quality is controlled and evaluated based on an examination of data source, data auditor and data error. And the data from the same article have a unique digital object identifier (DOI). Our building of this dataset is conducive to materials data sharing, intellectual property protection, and the development of nickel base superalloys in China, and it significantly meets the requirement of data-driven materials design.
Keywords: superalloy, superalloy dataset, International Symposium on Superalloys, data opening
數據庫(集)基本信息簡介
編輯數據庫(集)名稱 | 鎳基高溫合金材料數據集 |
數據作者 | 尹海清、徐斌、姜雪、張聰、曲選輝 |
數據通信作者 | 尹海清(hqyin@ustb.edu.cn) |
數據時間範圍 | 1980–2016年 |
數據量 | 約1.3萬條/18.9 MB |
數據格式 | *.xlsx |
數據服務系統網址 | http://www.materdata.cn/search2.php?tty=875 |
基金項目 | 國家重點研發計劃(2016YFB0700503) |
數據庫(集)組成 | 數據集展示為一個網頁頁面,但可以從後台形成一個Excel文件批量下載,數據集涉及粉末高溫合金、變形高溫合金和單晶高溫合金,包含6個部分:材料牌號與名稱、材料成分、原材料信息、性能信息、實驗條件和檢測條件。 |
Dataset Profile
編輯Title | A dataset of nickel-base superalloys |
Data corresponding author | Yin Haiqing (hqyin@ustb.edu.cn) |
Data authors | Yin Haiqing, Xu Bin, Jiang Xue, Zhang Cong, Qu Xuanhui. |
Time range | 1980–2016 |
Data volume | About 13 thousand entries/18.9 MB |
Data format | *.xlsx |
Data service system | <http://www.materdata.cn/search2.php?tty=875> |
Sources of funding | National Key Research and Development Program of China (2016YFB0700503) |
Dataset composition | The dataset is displayed as a web page with the files (Excel) accessible via the background downloads and bulk ones. Data from the three groups of superalloys, that is P/M, wrought and single crystal superalloys, are included in the dataset, containing the information on the materials brand and name, chemical composition, raw material, microstructure, performance, processing details and characterization conditions. |
引 言
編輯高溫合金具有優異的高溫強度、良好的抗氧化和抗熱腐蝕性能、良好的疲勞性能和斷裂韌性[1],是指在600℃以上的環境中能夠應對複雜的應力環境,並且可以保持表面穩定性的合金,是飛機發動機、汽車發動機常用材料。高溫合金分為鐵基、鎳基和鈷基3類高溫合金,其中由於鎳具有FCC結構組織穩定,室溫到高溫不發生同素異性轉變,500℃以下幾乎不氧化,且合金化能力強,添加十餘種元素無有害相的特點[2],因此是應用最為廣泛的高溫合金材料。鎳基高溫合金在650~1000℃範圍內具有較高的強度和良好的抗氧化、抗燃氣腐蝕能力[3],廣泛應用於航天發動機及航空發動機渦輪盤。高溫合金優異的力學性能是航空發動機穩定運行的保證,是推動航空事業發展的重點環節,因此研究鎳基高溫合金力學性能對於我國航天航空事業的發展具有重要意義[4]。自1956年第一爐高溫合金試煉成功,迄今為止,我國高溫合金的研究、生產和應用已經歷了多年的發展歷程。回顧多年的歷史,我國的高溫合金從無到有,從仿製到自主創新,合金的耐溫性能從低到高,先進工藝得到了應用,新型材料得以開發,生產工藝不斷改進且產品質量不斷提高,並建立和完善了我國的高溫合金體系,使我國航空、航天工業生產和發展所需的高溫合金材料立足於國內,也為其他工業部門的發展提供了需要的高溫材料[5]。
然而,高溫合金是國家重要軍備資源,保密性極強,美國高溫合金的生產企業主要有P&W、GE、Honeywell等,對高溫合金數據的管理十分嚴格,公司內部數據庫處於保密狀態,因此高溫合金數據的獲取並不容易。高溫合金數據方面,國外已有的涉及高溫合金的數據庫包括美國國家標準局材料性能數據庫,此數據庫部分關鍵數據收費;荷蘭PETTER歐洲研究中心的高溫材料數據庫,數據開放且數據涉及範圍為力學與熱力學;日本金屬研究所、日本金屬學會建立的金屬材料力學性能數據庫與日本國家材料科學研究所建立的「材料數據平台」處於數據開放狀態。歐美俄日等國家十分重視高溫合金信息的保護,國外高溫合金數據庫依附於各個研究機構,並且有較高的保密性。國內高溫合金數據庫有材料科學數據共享網,材料基因工程專用數據庫,但整體上高溫合金數據庫建設相對緩慢,對外公開的高溫合金數據庫較少,使得國家高溫合金數據交流困難,一定程度制約高溫合金髮展。所以國內學者使用高溫合金數據相對困難,資源獲取相對困難。
因此,建立高溫合金數據庫對未來國家航空發展具有重要的意義。本數據集希望拓寬高溫合金數據獲取通道,加強領域人才數據交流,實現數據共享,推動高溫合金研究發展,促進國家材料基因工程發展。
1 數據採集和處理方法
編輯1.1 數據源
編輯本數據集的數據來源包括四種途徑:(1)領域內最具影響力的國際高溫合金大會會議論文集(International Symposium on Superalloys);(2)《中國高溫合金手冊》[6];(3)鎳基高溫合金相圖熱力學計算數據;(4)國內外公開發表的優質期刊文章。其中國內外公開發表的高溫合金相關文章的數據採集仍在不斷進行中,數據集的數據量將不斷擴大。
國際高溫合金大會創立於1968年,每4年舉行一次,是高溫合金領域水平最高、影響力最大、歷史最悠久的國際性學術大會。每次會議均在9月舉行,由來自世界各地著名的科研院所與高校、發動機製造公司和高溫合金生產公司等產學研用單位的代表們參加,被譽為高溫合金界的「奧林匹克大會」[7]。國際高溫合金大會論文研究範圍包括鐵基高溫合金、鎳基高溫合金和鈷基高溫合金3類。而文章內容涉及鑄造(定向結晶、單晶、多晶)高溫合金工藝、變形高溫合金工藝和粉末冶金高溫合金工藝,並研究其蠕變性能、疲勞性能和腐蝕性能,還包括各元素對高溫合金組織性能的影響等多個方面,其廣泛的研究範圍為數據的開拓應用提供保障。目前收錄了1980年至2016年間的國際高溫合金大會會議論文集的文章數據。《中國高溫合金手冊》是國內權威高溫合金著作,高溫合金實驗數據可靠性強,是國內頂級的高溫合金參數著作。相圖計算以熱力學計算為基礎,通過添加元素計算高溫合金相組成,實現提高強化相含量、減少有害相含量的目的,是設計高溫合金的有效手段。以Acta Materialia為代表的國際知名結構材料學術期刊收納大量高溫合金相關學術文章,同樣包含大量高質量、實際應用意義強的高溫合金數據,可進一步拓展高溫合金研究。本數據集以高溫合金手冊、熱力學計算和優質論文作為數據採集對象,將論文集中鎳基高溫合金的實驗、計算類數據進行收集、整理,形成高溫合金數據集。
1.2 數據內容規範
編輯根據《材料科學數據統一描述規範的建立與應用》[8]對材料科學數據建立與描述方式的規範,以及《材料科學數據提交格式規範》對材料科學數據收集、整理、提交做出的統一格式要求[9],確定鎳基高溫合金數據內容(表1),最終獲得鎳基高溫合金數據集。鎳基高溫合金數據分為通用信息、材料牌號、材料名稱、化學成分、原材料信息、性能信息、實驗條件、數據生產與審核8個大模塊。每個大模塊下又會有各自的小模塊,細化鎳基高溫合金數據的描述,全面提取文章中的可用信息,保證數據的完整性。然後按照鎳基高溫合金數據模板內容在文章中尋找可用模板數據並記錄。
表1 鎳基高溫合金數據內容
模塊 | 子模塊 |
通用信息 | 創建時間、關鍵詞、提交者、摘要信息、DOI、數據錄入方式、模板名 |
材料牌號 | 材料牌號 |
材料名稱 | 材料名稱 |
化學成分 | 成分、比例 |
原材料信息 | 原材料名稱、原材料性能、性能值、單位、生產方法、生產商、備註 |
性能信息 | 性能類別、性能名稱、性能值、單位、測試設備與型號、檢測機構、性能相關圖片、性能相關附件 |
實驗條件 | 條件名稱、參數名、參數值、單位 |
數據生產與審核 | 數據生產者、數據審核者、備註 |
1.3 數據收集範圍
編輯本數據集中數據主要根據高溫合金實際應用需求進行收集。高溫合金的使用需求主要是力學性能滿足航空發動機實際要求,因此數據範圍主要包括拉伸強度、屈服強度、持久強度和蠕變強度等宏觀力學性能,以及晶格錯配度、相含量等影響宏觀力學性能的微觀組織特性。數據收集範圍以《中國高溫合金手冊》中涉及的性能為依據,以實際應用為嚮導,進一步促進高溫合金數據收集的發展。
1.4 數據採集與處理
編輯文章中的數據分為3類。第1類是數字化數據,第2類是文本數據,第3類是圖中數據。不同數據類型,其數據內容、數據所在位置和獲取方法不同。表2列舉了3種類型數據各自的數據內容範圍,數據所在位置和數據獲取方法。
表2 數據內容及其採集、處理方法
數據類型 | 數據內容 | 數據所在位置 | 獲取方法 |
數字化數據 | 材料成分 | Experimental | 閱讀摘錄 |
原材料信息 | Experimental | ||
性能信息 | Results | ||
文本數據 | 材料牌號 | Introduction | 閱讀摘錄 |
材料名稱 | Introduction | ||
實驗條件 | Experimental | ||
圖中數據 | 性能信息 | Results | 離散點圖:像素點轉化數值 |
擬合圖:不處理 |
2 數據樣本描述
編輯2.1 數據樣本
編輯鎳基高溫合金數據模板通用信息、材料牌號、材料名稱、化學成分、原材料信息、性能信息、實驗條件、數據生產與審核8個大模塊中,材料牌號、材料名稱、化學成分、性能信息與實驗條件5項是必填項,以此保證數據的完整性。
通用部分(圖1)包括創建時間、關鍵詞、提交者、摘要信息、DOI、數據錄入方式、模板名,展示數據的基本生產信息。
圖1 鎳基高溫合金數據樣本——通用部分
材料牌號、材料名稱(圖2)兩部分是該高溫合金的常用名稱。
圖2 鎳基高溫合金數據樣本——材料牌號、材料名稱
化學成分(圖3)是將高溫合金的所有添加組元進行記錄,並且每一種化學成分對應着其百分含量。
圖3 鎳基高溫合金數據樣本——化學成分
原材料信息(圖4)主要展示原材的特性,包括原材的某些性能特性及其生產過程。但是一般來說,文章中相關記錄不多。
圖4 鎳基高溫合金數據樣本——原材料信息
性能信息(圖5)中微觀組織、性能類別、性能名稱、性能值與單位一一對應,與性能相關附件關聯的是文章中相關材料的微觀組織圖片與性能數據。
圖5 鎳基高溫合金數據樣本——性能信息
實驗條件(圖6)將文章中所描述的實驗步驟全部記錄下來,包括其製備過程與測試過程的工藝參數等,實現全流程數據的記錄。
圖6 鎳基高溫合金數據樣本——實驗條件
數據生產與審核(圖7)需要提交人記錄摘錄人員及其審核數據人員信息,並且要求審核人員具有一定業內知識水平,保證數據合理性。
圖7 鎳基高溫合金數據樣本——數據生產與審核
其他信息(圖8)是數據的來源方式,按照國標GB/T7714記錄所摘錄的文章。
圖8 鎳基高溫合金數據樣本——其他信息
2.2 數據存儲
編輯本數據集以網頁形式進行展示,數據存儲於服務器之中,響應大數據的時代要求並為後續數據補充添加打下基礎。數據存儲形式擺脫傳統單機模式、共享困難的Excel表存儲形式,以網頁頁面的形式展示數據以促進數據共享。同時,數據使用過程中可以實現Excel表形式的數據集調用,方便研究人員的數據使用。
未來,數據量增加至一定量時,會將數據集形成軟件,實現更加合理方便的數據調用,促進國家高溫合金的研究與發展。
2.3 數據DOI標識
編輯數字對象唯一標識符(Digital Object Identifier,簡稱DOI)是由美國出版協會(The Association of America Publishers,簡稱AAP)創建,由國際數字對象唯一標識符基金會(International DOI Foundation,簡稱IDF)負責運行的數字對象唯一標識符系統[10]。材料科學數據的DOI編碼格式為「DOI:10.institution/classification.project.date.type.sequence」。圖9為DOI標識示例與內容描述。本數據集建立了材料數據的DOI標識,來自同一篇文章的數據擁有唯一的DOI標識,是數據集中對數據知識產權的描述,保證數據的知識產權不受侵害。
圖9 數據DOI標識示例與內容描述
3 數據質量控制和評估
編輯本數據從數據來源、數據審核人和數據誤差率3個方面對數據質量進行控制和評價。
材料科學數據可以分為完全可靠、一般可靠和有待驗證3類,其中完全可靠的數據指已公開發行的手冊、標準、書籍等出版物的數據,一般可靠指的是公開發表的論文的數據。本數據集的數據來源是高溫合金領域的公開出版的權威手冊以及公開發表的論文,數據可靠程度高,最大程度上保證了本數據集的可靠性。
本數據集採用人工方法從手冊或論文中獲取數據。對於文中明確給出的數據內容,數字化數據進行完整摘錄,所收集數據與原文數據一致。對於文章中圖片給出的散點數據,採用人工抽選對照校驗,隨機抽取300條數據進行重新描點對照,獲取數據誤差率在3%以內。
數據審核者要求是高溫合金領域的知名學者或具有足夠知識水平能力保證數據正確性的人員,以此保證數據質量,本數據集的審核人是具有高溫合金材料相關豐富知識和經驗的老師。由於數據來源可靠,數據的審核主要針對數據化過程中可能出現的轉化誤差或操作誤差。除此之外,對於審核過程中發現的少數不符合高溫合金常規認知的可疑數據,進行了人工刪除。
4 數據價值
編輯由於國外高溫合金數據庫對數據保密程度高,國內學者使用數據非常困難。因此,本數據集收集高溫合金數據並對外公開,旨在突破數據信息交流的壁壘,使數據為高溫合金領域的研究學者和設計人員所共享,充分發揮數據的使用價值。
本數據集涵蓋整個材料的過程信息,使數據使用人員能夠清晰地理解材料每一個步驟的變化。數據量約1.3萬條數據,為大數據分析提供數據基礎。使用神經網絡、支持向量機、回歸分析及多元線性回歸等多種方法進行數學分析,可以為採用數據挖掘方法研究高溫合金奠定堅實的數據基礎。同時,採用大數據技術進行研究,契合材料基因工程的思想,有助於推動國家材料基因工程的發展。
同時,本工作獨創性地應用DOI標識解決了材料數據的知識產權保護難題,對每一條數據和本數據集進行知識產權保護,明確數據的產出,使DOI成為推動數據共享的重要舉措。
致 謝
編輯在此,感謝張桐、鄧正華、楊國強、楊艷艷、劉麗、榮斌斌、宣佳輝、徐志峰、張凱琦、史政濤、張國飛、張柳、李龍飛、黃淋、王彬、胡仕傑、張丹、張天向為本數據集的收集工作做出的貢獻。
參考文獻
編輯- ↑ 郭茂文, 劉春榮, 鄭雪萍, 等. 粉末高溫合金的研究現狀[J]. 熱加工工藝, 2017(20): 11-13.
- ↑ 陳國良. 高溫合金學[M]. 冶金工業出版社, 1988.
- ↑ 黃乾堯, 李漢康. 高溫合金[M]. 冶金工業出版社, 2000.
- ↑ 王會陽, 安雲岐, 李承宇, 等. 鎳基高溫合金材料的研究進展[J]. 材料導報, 2011(s2): 482-486.
- ↑ 師昌緒, 仲增墉. 我國高溫合金的發展與創新[J]. 金屬學報, 2010, 46(11): 1281-1288.
- ↑ 中國金屬學會高溫材料分會. 中國高溫合金手冊[M]. 北京: 中國標準出版社, 2012.
- ↑ 材料國重. 中國培養的博士研究生首次在國際高溫合金大會上獲獎-北科大博士生們閃耀在國際高溫合金界的學術舞台[EB/OL]. (2016–09–21) [2018–08–121]. http://news.ustb.edu.cn/xinwendaodu/2016-09-21/63890.html.
- ↑ 姜雪, 張聰, 張凱琦, 等. 材料科學數據統一描述規範的建立與應用[J]. 科研信息化技術與應用, 2017, 8(1): 35-44.
- ↑ 材料科學數據共享網. 材料科學數據統一描述規範[EB/OL]. (2018–04–01) [2018–08–12]. http://www.materdata.cn/view.php?id=220
- ↑ 材料科學數據共享網. 材料數據對象唯一標識符命名與註冊規範[EB/OL]. (2018–04–01) [2018–08–12]. http://www.materdata.cn/view.php?id=195.
數據引用格式
編輯尹海清, 徐斌, 姜雪, 等. 鎳基高溫合金材料數據集[DB/OL]. 材料科學數據共享網, 2018. (2018-11-19). DOI: 10.11961/mater0203.MGI.20171221.db.0055.