本文摘要:摘要:針對(duì)材料服役性能預(yù)測(cè)存在誤差大、計(jì)算復(fù)雜、適用性差等問(wèn)題,提出了基于數(shù)據(jù)挖掘的機(jī)器學(xué)習(xí)預(yù)測(cè)方法。首先闡述了機(jī)器學(xué)習(xí)的應(yīng)用流程,并總結(jié)了常用模型原理及其在材料性能預(yù)測(cè)中的應(yīng)用。然后采用多種機(jī)器學(xué)習(xí)模型對(duì)RPV鋼的輻照性能進(jìn)行預(yù)測(cè),并通過(guò)St
摘要:針對(duì)材料服役性能預(yù)測(cè)存在誤差大、計(jì)算復(fù)雜、適用性差等問(wèn)題,提出了基于數(shù)據(jù)挖掘的機(jī)器學(xué)習(xí)預(yù)測(cè)方法。首先闡述了機(jī)器學(xué)習(xí)的應(yīng)用流程,并總結(jié)了常用模型原理及其在材料性能預(yù)測(cè)中的應(yīng)用。然后采用多種機(jī)器學(xué)習(xí)模型對(duì)RPV鋼的輻照性能進(jìn)行預(yù)測(cè),并通過(guò)Stacking集成方法提高了模型的預(yù)測(cè)精度。結(jié)果表明,機(jī)器學(xué)習(xí)可用于材料服役性能預(yù)測(cè),具有較高的預(yù)測(cè)精度和可靠性。根據(jù)材料服役數(shù)據(jù)的不同特征選擇合適的學(xué)習(xí)模型,同時(shí)進(jìn)行模型融合和參數(shù)優(yōu)化,可有效提高模型的預(yù)測(cè)精度及運(yùn)算速度。
關(guān)鍵詞:數(shù)據(jù)挖掘;機(jī)器學(xué)習(xí);服役性能;材料工程;模型預(yù)測(cè)
引言
材料在服役過(guò)程中,由于受光照、熱能、機(jī)械能、輻照、潮濕等因素的影響,會(huì)逐步發(fā)生老化,進(jìn)而導(dǎo)致材料性能下降甚至失效[1]。材料失效不僅帶來(lái)巨大的經(jīng)濟(jì)損失,造成環(huán)境污染和資源浪費(fèi),甚至可能釀成安全事故,引發(fā)各種社會(huì)問(wèn)題。因此,材料服役性能研究和服役壽命預(yù)測(cè)一直是材料領(lǐng)域的研究熱點(diǎn)之一。在早期研究中,通常將材料放置在自然環(huán)境或人工模擬環(huán)境中進(jìn)行大量性能試驗(yàn),并在試驗(yàn)過(guò)程中監(jiān)測(cè)材料性能變化情況。
然后找出試驗(yàn)條件和材料性能之間的關(guān)系,進(jìn)而預(yù)測(cè)材料服役性能的變化趨勢(shì)和服役壽命。但這種方法通常需要投放大量的試樣,試驗(yàn)周期漫長(zhǎng),無(wú)法真實(shí)反映出實(shí)際環(huán)境中不同因素之間的協(xié)同作用和綜合效應(yīng),在客觀性和普適性方面存在不足[2]。目前,材料服役性能研究主要分為四個(gè)方向:加速模擬實(shí)驗(yàn)[3]、力學(xué)性能研究[4]、數(shù)學(xué)模型[5]和數(shù)據(jù)挖掘[6]。
人工智能論文: 機(jī)器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)氣象中的應(yīng)用
其中,加速模擬實(shí)驗(yàn)是最簡(jiǎn)便可行的方案,但加速過(guò)程會(huì)掩蓋材料服役的關(guān)鍵細(xì)節(jié),很難區(qū)分不同條件對(duì)材料性能影響的細(xì)微差別。力學(xué)性能研究通過(guò)經(jīng)典力學(xué)、斷裂力學(xué)、疲勞力學(xué)、損傷力學(xué)等方法建立材料力學(xué)方程,然后進(jìn)行力學(xué)分析和服役性能預(yù)測(cè)。但對(duì)于受力復(fù)雜的情況,建立的力學(xué)方程非常復(fù)雜,并且很難反映材料的真實(shí)受力情況。數(shù)學(xué)模型通過(guò)短期試驗(yàn)推測(cè)長(zhǎng)期服役條件下材料的性能變化情況,但該方法預(yù)測(cè)誤差較大、計(jì)算復(fù)雜、普適性有待進(jìn)一步研究。數(shù)據(jù)挖掘通過(guò)機(jī)器學(xué)習(xí)對(duì)大量材料服役數(shù)據(jù)進(jìn)行學(xué)習(xí)和規(guī)律總結(jié),然后對(duì)材料服役性能進(jìn)行預(yù)測(cè),目前已經(jīng)在醫(yī)藥[7]、生物信息[8]、圖像識(shí)別[9]、故障診斷[10]等領(lǐng)域取得了應(yīng)用成果。
本文首先闡述了機(jī)器學(xué)習(xí)在材料服役性能預(yù)測(cè)中的一般流程及常用機(jī)器學(xué)習(xí)模型原理,并對(duì)各種模型在材料服役性能研究應(yīng)用中的特點(diǎn)進(jìn)行總結(jié)。然后具體研究了機(jī)器學(xué)習(xí)在RPV鋼輻照性能預(yù)測(cè)中的應(yīng)用,研究結(jié)果為材料服役性能預(yù)測(cè)提供新的方法和參考。
基于機(jī)器學(xué)習(xí)的材料服役性能預(yù)測(cè)機(jī)器學(xué)習(xí)在材料服役性能預(yù)測(cè)的一般流程如圖所示,其主要包括兩個(gè)過(guò)程:1)從材料基因數(shù)據(jù)庫(kù)中選擇要處理的數(shù)據(jù)并進(jìn)行預(yù)處理、特征選擇和樣本劃分,然后通過(guò)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練、測(cè)試和評(píng)估,并獲得最優(yōu)模型及模型參數(shù);2)通過(guò)最優(yōu)模型對(duì)新數(shù)據(jù)進(jìn)行服役性能預(yù)測(cè),獲得最終結(jié)果。材料基因數(shù)據(jù)庫(kù)為源數(shù)據(jù),可源于試驗(yàn)、測(cè)試、仿真計(jì)算或其他數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)中數(shù)據(jù)的來(lái)源、格式、完整度等存在差異,需要進(jìn)行數(shù)據(jù)清洗使其符合機(jī)器學(xué)習(xí)模型的輸入要求,數(shù)據(jù)清洗包括異常值剔除、缺失值填充、重復(fù)樣本刪除、數(shù)字化等。對(duì)于量綱不同或存在數(shù)量級(jí)差異的特征值,還需要進(jìn)行歸一化或標(biāo)準(zhǔn)化處理,消除量綱帶來(lái)的偏差。
數(shù)據(jù)清洗和預(yù)處理后需要進(jìn)行特征選擇,找出和目標(biāo)相關(guān)度高的特征進(jìn)行學(xué)習(xí)和訓(xùn)練,消除無(wú)關(guān)特征帶來(lái)的噪聲偏差。常用的特征選擇方法有過(guò)濾式、包裹式和嵌入式,篩選后的特征子集可提高模型的訓(xùn)練效率和預(yù)測(cè)精度。獲得特征子集后,通過(guò)分層抽樣將其劃分為訓(xùn)練集和測(cè)試集,測(cè)試集約占總樣本的20%~30%。然后選擇合適的模型,并在訓(xùn)練集上進(jìn)行模型訓(xùn)練和參數(shù)調(diào)優(yōu)。模型訓(xùn)練后,根據(jù)預(yù)測(cè)結(jié)果進(jìn)行模型評(píng)估,常用的評(píng)估指標(biāo)有平均絕對(duì)誤差、均方根誤差和決定系數(shù)等。
2機(jī)器學(xué)習(xí)模型
材料服役性能預(yù)測(cè)屬于有監(jiān)督學(xué)習(xí),常用的機(jī)器學(xué)習(xí)模型有支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)和隨機(jī)森林等。
2.1支持向量機(jī)
支持向量機(jī)的目的是獲得維空間的最優(yōu)超平面[11]。支持向量機(jī)可解決三類(lèi)問(wèn)題:1)樣本線性可分,通過(guò)硬間隔最大學(xué)習(xí)一個(gè)分類(lèi)器;2)樣本近似線性可分,通過(guò)軟間隔最大學(xué)習(xí)一個(gè)分類(lèi)器;3)樣本線性不可分,通過(guò)核技法將低維非線性問(wèn)題轉(zhuǎn)化為高維線性問(wèn)題,然后學(xué)習(xí)一個(gè)非線性支持向量機(jī)。
3機(jī)器學(xué)習(xí)在材料服役性能預(yù)測(cè)中的應(yīng)用
材料服役性能與其結(jié)構(gòu)、成分、環(huán)境條件等密切相關(guān),不同因素之間相互作用復(fù)雜。機(jī)器學(xué)習(xí)可以從大量服役數(shù)據(jù)中獲得各因素之間的影響規(guī)律,并對(duì)服役性能進(jìn)行預(yù)測(cè)。材料的服役性能主要包括腐蝕、磨損、輻照能和疲勞等。
3.1腐蝕性能預(yù)測(cè)
材料腐蝕的因素包括化學(xué)成分、組織結(jié)構(gòu)、加工工藝、服役條件等,并且不同因素又包含多個(gè)維度信息,通常采用人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等擬合能力強(qiáng)、適用緯度高的模型進(jìn)行腐蝕性能預(yù)測(cè)。杜翠微等[13]采用人工神經(jīng)網(wǎng)絡(luò)建立了碳鋼和低合金鋼的腐蝕速率預(yù)測(cè)模型,探究了化學(xué)成分、環(huán)境因素及多因素耦合作用對(duì)海水中金屬材料腐蝕性能的影響。訓(xùn)練數(shù)據(jù)為我國(guó)典型海水區(qū)域長(zhǎng)達(dá)16年的腐蝕樣本,模型輸入為合金主要元素成分、溫度、溶解氧、鹽度、生物附著物等。
當(dāng)僅考慮環(huán)境因素時(shí),模型的預(yù)測(cè)精度達(dá)到75%;當(dāng)同時(shí)考慮環(huán)境因素和材料元素含量時(shí),模型的預(yù)測(cè)精度可提高到90%以上。LY12CZ鋁合金是飛機(jī)承重構(gòu)件的主要材料,劉延利等[14]通過(guò)鹽霧試驗(yàn)獲得了鋁合金材料的腐蝕試樣,并對(duì)試樣進(jìn)行疲勞試驗(yàn)和腐蝕深度測(cè)量。然后建立了基于腐蝕溫度、腐蝕時(shí)間、最大點(diǎn)蝕深度及疲勞額定強(qiáng)度的人工神經(jīng)網(wǎng)絡(luò)模型,模型對(duì)試樣最大腐蝕深度的預(yù)測(cè)誤差為7.24%,對(duì)疲勞額定強(qiáng)度的預(yù)測(cè)誤差為1.63%。
為驗(yàn)證RENiCu合金鑄鐵在堿液中的腐蝕性能,王玉榮等[15]通過(guò)靜態(tài)質(zhì)量損失腐蝕試驗(yàn)獲得了35組腐蝕樣本數(shù)據(jù),然后建立了合金成分、腐蝕時(shí)間、堿液溫度與合金鑄鐵腐蝕深度的RBF神經(jīng)網(wǎng)絡(luò)模型。RBF神經(jīng)網(wǎng)絡(luò)對(duì)合金鑄鐵腐蝕深度的預(yù)測(cè)誤差為8.09%,對(duì)樣本的耐腐蝕等級(jí)和耐腐蝕評(píng)價(jià)準(zhǔn)確率達(dá)到100%。海底管道腐蝕速率的有效預(yù)測(cè)可減少管道失效風(fēng)險(xiǎn),李響等[16]基于Q235鋼材海洋掛片的腐蝕數(shù)據(jù)建立了環(huán)境溫度、含氧量、含鹽量、PH和腐蝕速率之間的SVM模型。
首先采用遺傳算法對(duì)模型參數(shù)進(jìn)行優(yōu)化,優(yōu)化后的模型對(duì)試樣腐蝕速率的預(yù)測(cè)誤差小于3%,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型。針對(duì)長(zhǎng)輸管道腐蝕速率的預(yù)測(cè),馬鋼等[17]建立了PSOSVM模型,模型輸入為
4基于模型融合的RPV鋼輻照性能預(yù)測(cè)
4.1輻照數(shù)據(jù)
本文所用的RPV鋼輻照數(shù)據(jù)來(lái)源于文獻(xiàn)數(shù)據(jù)[30,31]及試驗(yàn)數(shù)據(jù),共有390條有效樣本,數(shù)據(jù)分布如圖所示。首先剔除與輻照性能相關(guān)性較弱的特征,最終選擇中子注量、注量率、輻照溫度、Cu含量、Ni含量、Mn含量、Si含量、含量作為模型輸入,輻照后的轉(zhuǎn)變溫度增量ΔRTNDT作為模型輸出。
4.2數(shù)據(jù)劃分
由于RPV鋼輻照數(shù)據(jù)樣本較小且離散性大,因此需要保證數(shù)據(jù)劃分后仍保持原始數(shù)據(jù)的分布規(guī)律,避免數(shù)據(jù)不均衡造成預(yù)測(cè)偏差。首先對(duì)相關(guān)性較高的Cu含量進(jìn)行區(qū)間劃分并標(biāo)記為個(gè)類(lèi)別,然后按類(lèi)別進(jìn)行分層抽樣,抽樣結(jié)果如表所示。其中分層抽樣后的樣本分布與原數(shù)據(jù)基本相同,最大誤差為4.76%,小于隨機(jī)抽樣的8.57%。分層抽樣后,將80%的數(shù)據(jù)用作訓(xùn)練,20%用作測(cè)試。
5總結(jié)與展望
本文從機(jī)器學(xué)習(xí)流程出發(fā),首先概括了常用機(jī)器學(xué)習(xí)模型的原理及其在材料服役性能預(yù)測(cè)中的應(yīng)用。然后采用多種機(jī)器學(xué)習(xí)模型對(duì)RPV鋼的輻照性能進(jìn)行預(yù)測(cè),并采用Stacking方法提高了模型的預(yù)測(cè)精度,主要結(jié)論如下:(1)機(jī)器學(xué)習(xí)可用于材料服役性能預(yù)測(cè),具有較高的預(yù)測(cè)精度和可靠性;(2)模型選擇應(yīng)考慮材料服役數(shù)據(jù)的質(zhì)量、模型特點(diǎn)及樣本數(shù)量;(3)重要特征提取、模型融合和參數(shù)優(yōu)化算法可提高模型的精度和運(yùn)算效率。目前,機(jī)器學(xué)習(xí)在材料服役性能預(yù)測(cè)中的應(yīng)用仍處于初級(jí)階段,大量工作仍需進(jìn)一步開(kāi)展。如豐富完善已有的材料基因數(shù)據(jù)庫(kù)、開(kāi)展更高精度機(jī)器學(xué)習(xí)算法研究、優(yōu)化機(jī)器學(xué)習(xí)模型參數(shù),提高運(yùn)算效率、結(jié)合物理模型及相關(guān)理論,增強(qiáng)機(jī)器學(xué)習(xí)模型的解釋性。
作者:王紅珂,劉嘯天,林磊,孫海濤,呂云鶴,張晏瑋,薛飛
轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/27796.html