本文摘要:摘要:針對材料服役性能預(yù)測存在誤差大、計算復(fù)雜、適用性差等問題,提出了基于數(shù)據(jù)挖掘的機器學(xué)習(xí)預(yù)測方法。首先闡述了機器學(xué)習(xí)的應(yīng)用流程,并總結(jié)了常用模型原理及其在材料性能預(yù)測中的應(yīng)用。然后采用多種機器學(xué)習(xí)模型對RPV鋼的輻照性能進行預(yù)測,并通過St
摘要:針對材料服役性能預(yù)測存在誤差大、計算復(fù)雜、適用性差等問題,提出了基于數(shù)據(jù)挖掘的機器學(xué)習(xí)預(yù)測方法。首先闡述了機器學(xué)習(xí)的應(yīng)用流程,并總結(jié)了常用模型原理及其在材料性能預(yù)測中的應(yīng)用。然后采用多種機器學(xué)習(xí)模型對RPV鋼的輻照性能進行預(yù)測,并通過Stacking集成方法提高了模型的預(yù)測精度。結(jié)果表明,機器學(xué)習(xí)可用于材料服役性能預(yù)測,具有較高的預(yù)測精度和可靠性。根據(jù)材料服役數(shù)據(jù)的不同特征選擇合適的學(xué)習(xí)模型,同時進行模型融合和參數(shù)優(yōu)化,可有效提高模型的預(yù)測精度及運算速度。
關(guān)鍵詞:數(shù)據(jù)挖掘;機器學(xué)習(xí);服役性能;材料工程;模型預(yù)測
引言
材料在服役過程中,由于受光照、熱能、機械能、輻照、潮濕等因素的影響,會逐步發(fā)生老化,進而導(dǎo)致材料性能下降甚至失效[1]。材料失效不僅帶來巨大的經(jīng)濟損失,造成環(huán)境污染和資源浪費,甚至可能釀成安全事故,引發(fā)各種社會問題。因此,材料服役性能研究和服役壽命預(yù)測一直是材料領(lǐng)域的研究熱點之一。在早期研究中,通常將材料放置在自然環(huán)境或人工模擬環(huán)境中進行大量性能試驗,并在試驗過程中監(jiān)測材料性能變化情況。
然后找出試驗條件和材料性能之間的關(guān)系,進而預(yù)測材料服役性能的變化趨勢和服役壽命。但這種方法通常需要投放大量的試樣,試驗周期漫長,無法真實反映出實際環(huán)境中不同因素之間的協(xié)同作用和綜合效應(yīng),在客觀性和普適性方面存在不足[2]。目前,材料服役性能研究主要分為四個方向:加速模擬實驗[3]、力學(xué)性能研究[4]、數(shù)學(xué)模型[5]和數(shù)據(jù)挖掘[6]。
人工智能論文: 機器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)氣象中的應(yīng)用
其中,加速模擬實驗是最簡便可行的方案,但加速過程會掩蓋材料服役的關(guān)鍵細節(jié),很難區(qū)分不同條件對材料性能影響的細微差別。力學(xué)性能研究通過經(jīng)典力學(xué)、斷裂力學(xué)、疲勞力學(xué)、損傷力學(xué)等方法建立材料力學(xué)方程,然后進行力學(xué)分析和服役性能預(yù)測。但對于受力復(fù)雜的情況,建立的力學(xué)方程非常復(fù)雜,并且很難反映材料的真實受力情況。數(shù)學(xué)模型通過短期試驗推測長期服役條件下材料的性能變化情況,但該方法預(yù)測誤差較大、計算復(fù)雜、普適性有待進一步研究。數(shù)據(jù)挖掘通過機器學(xué)習(xí)對大量材料服役數(shù)據(jù)進行學(xué)習(xí)和規(guī)律總結(jié),然后對材料服役性能進行預(yù)測,目前已經(jīng)在醫(yī)藥[7]、生物信息[8]、圖像識別[9]、故障診斷[10]等領(lǐng)域取得了應(yīng)用成果。
本文首先闡述了機器學(xué)習(xí)在材料服役性能預(yù)測中的一般流程及常用機器學(xué)習(xí)模型原理,并對各種模型在材料服役性能研究應(yīng)用中的特點進行總結(jié)。然后具體研究了機器學(xué)習(xí)在RPV鋼輻照性能預(yù)測中的應(yīng)用,研究結(jié)果為材料服役性能預(yù)測提供新的方法和參考。
基于機器學(xué)習(xí)的材料服役性能預(yù)測機器學(xué)習(xí)在材料服役性能預(yù)測的一般流程如圖所示,其主要包括兩個過程:1)從材料基因數(shù)據(jù)庫中選擇要處理的數(shù)據(jù)并進行預(yù)處理、特征選擇和樣本劃分,然后通過機器學(xué)習(xí)模型進行訓(xùn)練、測試和評估,并獲得最優(yōu)模型及模型參數(shù);2)通過最優(yōu)模型對新數(shù)據(jù)進行服役性能預(yù)測,獲得最終結(jié)果。材料基因數(shù)據(jù)庫為源數(shù)據(jù),可源于試驗、測試、仿真計算或其他數(shù)據(jù)庫。數(shù)據(jù)庫中數(shù)據(jù)的來源、格式、完整度等存在差異,需要進行數(shù)據(jù)清洗使其符合機器學(xué)習(xí)模型的輸入要求,數(shù)據(jù)清洗包括異常值剔除、缺失值填充、重復(fù)樣本刪除、數(shù)字化等。對于量綱不同或存在數(shù)量級差異的特征值,還需要進行歸一化或標(biāo)準化處理,消除量綱帶來的偏差。
數(shù)據(jù)清洗和預(yù)處理后需要進行特征選擇,找出和目標(biāo)相關(guān)度高的特征進行學(xué)習(xí)和訓(xùn)練,消除無關(guān)特征帶來的噪聲偏差。常用的特征選擇方法有過濾式、包裹式和嵌入式,篩選后的特征子集可提高模型的訓(xùn)練效率和預(yù)測精度。獲得特征子集后,通過分層抽樣將其劃分為訓(xùn)練集和測試集,測試集約占總樣本的20%~30%。然后選擇合適的模型,并在訓(xùn)練集上進行模型訓(xùn)練和參數(shù)調(diào)優(yōu)。模型訓(xùn)練后,根據(jù)預(yù)測結(jié)果進行模型評估,常用的評估指標(biāo)有平均絕對誤差、均方根誤差和決定系數(shù)等。
2機器學(xué)習(xí)模型
材料服役性能預(yù)測屬于有監(jiān)督學(xué)習(xí),常用的機器學(xué)習(xí)模型有支持向量機、人工神經(jīng)網(wǎng)絡(luò)、決策樹和隨機森林等。
2.1支持向量機
支持向量機的目的是獲得維空間的最優(yōu)超平面[11]。支持向量機可解決三類問題:1)樣本線性可分,通過硬間隔最大學(xué)習(xí)一個分類器;2)樣本近似線性可分,通過軟間隔最大學(xué)習(xí)一個分類器;3)樣本線性不可分,通過核技法將低維非線性問題轉(zhuǎn)化為高維線性問題,然后學(xué)習(xí)一個非線性支持向量機。
3機器學(xué)習(xí)在材料服役性能預(yù)測中的應(yīng)用
材料服役性能與其結(jié)構(gòu)、成分、環(huán)境條件等密切相關(guān),不同因素之間相互作用復(fù)雜。機器學(xué)習(xí)可以從大量服役數(shù)據(jù)中獲得各因素之間的影響規(guī)律,并對服役性能進行預(yù)測。材料的服役性能主要包括腐蝕、磨損、輻照能和疲勞等。
3.1腐蝕性能預(yù)測
材料腐蝕的因素包括化學(xué)成分、組織結(jié)構(gòu)、加工工藝、服役條件等,并且不同因素又包含多個維度信息,通常采用人工神經(jīng)網(wǎng)絡(luò)、支持向量機等擬合能力強、適用緯度高的模型進行腐蝕性能預(yù)測。杜翠微等[13]采用人工神經(jīng)網(wǎng)絡(luò)建立了碳鋼和低合金鋼的腐蝕速率預(yù)測模型,探究了化學(xué)成分、環(huán)境因素及多因素耦合作用對海水中金屬材料腐蝕性能的影響。訓(xùn)練數(shù)據(jù)為我國典型海水區(qū)域長達16年的腐蝕樣本,模型輸入為合金主要元素成分、溫度、溶解氧、鹽度、生物附著物等。
當(dāng)僅考慮環(huán)境因素時,模型的預(yù)測精度達到75%;當(dāng)同時考慮環(huán)境因素和材料元素含量時,模型的預(yù)測精度可提高到90%以上。LY12CZ鋁合金是飛機承重構(gòu)件的主要材料,劉延利等[14]通過鹽霧試驗獲得了鋁合金材料的腐蝕試樣,并對試樣進行疲勞試驗和腐蝕深度測量。然后建立了基于腐蝕溫度、腐蝕時間、最大點蝕深度及疲勞額定強度的人工神經(jīng)網(wǎng)絡(luò)模型,模型對試樣最大腐蝕深度的預(yù)測誤差為7.24%,對疲勞額定強度的預(yù)測誤差為1.63%。
為驗證RENiCu合金鑄鐵在堿液中的腐蝕性能,王玉榮等[15]通過靜態(tài)質(zhì)量損失腐蝕試驗獲得了35組腐蝕樣本數(shù)據(jù),然后建立了合金成分、腐蝕時間、堿液溫度與合金鑄鐵腐蝕深度的RBF神經(jīng)網(wǎng)絡(luò)模型。RBF神經(jīng)網(wǎng)絡(luò)對合金鑄鐵腐蝕深度的預(yù)測誤差為8.09%,對樣本的耐腐蝕等級和耐腐蝕評價準確率達到100%。海底管道腐蝕速率的有效預(yù)測可減少管道失效風(fēng)險,李響等[16]基于Q235鋼材海洋掛片的腐蝕數(shù)據(jù)建立了環(huán)境溫度、含氧量、含鹽量、PH和腐蝕速率之間的SVM模型。
首先采用遺傳算法對模型參數(shù)進行優(yōu)化,優(yōu)化后的模型對試樣腐蝕速率的預(yù)測誤差小于3%,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型。針對長輸管道腐蝕速率的預(yù)測,馬鋼等[17]建立了PSOSVM模型,模型輸入為
4基于模型融合的RPV鋼輻照性能預(yù)測
4.1輻照數(shù)據(jù)
本文所用的RPV鋼輻照數(shù)據(jù)來源于文獻數(shù)據(jù)[30,31]及試驗數(shù)據(jù),共有390條有效樣本,數(shù)據(jù)分布如圖所示。首先剔除與輻照性能相關(guān)性較弱的特征,最終選擇中子注量、注量率、輻照溫度、Cu含量、Ni含量、Mn含量、Si含量、含量作為模型輸入,輻照后的轉(zhuǎn)變溫度增量ΔRTNDT作為模型輸出。
4.2數(shù)據(jù)劃分
由于RPV鋼輻照數(shù)據(jù)樣本較小且離散性大,因此需要保證數(shù)據(jù)劃分后仍保持原始數(shù)據(jù)的分布規(guī)律,避免數(shù)據(jù)不均衡造成預(yù)測偏差。首先對相關(guān)性較高的Cu含量進行區(qū)間劃分并標(biāo)記為個類別,然后按類別進行分層抽樣,抽樣結(jié)果如表所示。其中分層抽樣后的樣本分布與原數(shù)據(jù)基本相同,最大誤差為4.76%,小于隨機抽樣的8.57%。分層抽樣后,將80%的數(shù)據(jù)用作訓(xùn)練,20%用作測試。
5總結(jié)與展望
本文從機器學(xué)習(xí)流程出發(fā),首先概括了常用機器學(xué)習(xí)模型的原理及其在材料服役性能預(yù)測中的應(yīng)用。然后采用多種機器學(xué)習(xí)模型對RPV鋼的輻照性能進行預(yù)測,并采用Stacking方法提高了模型的預(yù)測精度,主要結(jié)論如下:(1)機器學(xué)習(xí)可用于材料服役性能預(yù)測,具有較高的預(yù)測精度和可靠性;(2)模型選擇應(yīng)考慮材料服役數(shù)據(jù)的質(zhì)量、模型特點及樣本數(shù)量;(3)重要特征提取、模型融合和參數(shù)優(yōu)化算法可提高模型的精度和運算效率。目前,機器學(xué)習(xí)在材料服役性能預(yù)測中的應(yīng)用仍處于初級階段,大量工作仍需進一步開展。如豐富完善已有的材料基因數(shù)據(jù)庫、開展更高精度機器學(xué)習(xí)算法研究、優(yōu)化機器學(xué)習(xí)模型參數(shù),提高運算效率、結(jié)合物理模型及相關(guān)理論,增強機器學(xué)習(xí)模型的解釋性。
作者:王紅珂,劉嘯天,林磊,孫海濤,呂云鶴,張晏瑋,薛飛
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/27796.html