本文摘要:摘 要:對(duì)裝備質(zhì)量信息進(jìn)行分析和處理是準(zhǔn)確掌握裝備性能狀態(tài),提高裝備保障水平的關(guān)鍵。隨著計(jì)算機(jī)技術(shù)與信息技術(shù)的不斷發(fā)展和大數(shù)據(jù)的運(yùn)用,部隊(duì)亟需裝備質(zhì)量信息分析處理技術(shù)以充分利用裝備質(zhì)量數(shù)據(jù)資源,基于數(shù)據(jù)挖掘的裝備質(zhì)量信息分析處理技術(shù)正逐漸成為裝備保障
摘 要:對(duì)裝備質(zhì)量信息進(jìn)行分析和處理是準(zhǔn)確掌握裝備性能狀態(tài),提高裝備保障水平的關(guān)鍵。隨著計(jì)算機(jī)技術(shù)與信息技術(shù)的不斷發(fā)展和大數(shù)據(jù)的運(yùn)用,部隊(duì)亟需裝備質(zhì)量信息分析處理技術(shù)以充分利用裝備質(zhì)量數(shù)據(jù)資源,基于數(shù)據(jù)挖掘的裝備質(zhì)量信息分析處理技術(shù)正逐漸成為裝備保障領(lǐng)域的重要研究方向。從因果分析、關(guān)聯(lián)分析和數(shù)據(jù)處理幾個(gè)方面論述了裝備質(zhì)量信息分析處理的研究?jī)?nèi)容,梳理了數(shù)據(jù)挖掘的方法,并闡述了國(guó)內(nèi)外研究現(xiàn)狀。簡(jiǎn)要分析了各類(lèi)數(shù)據(jù)挖掘技術(shù)面向裝備質(zhì)量信息分析處理不同研究點(diǎn)時(shí)的適用性。探討了基于數(shù)據(jù)挖掘的裝備質(zhì)量信息分析處理面臨的主要問(wèn)題及其未來(lái)發(fā)展方向。
關(guān)鍵詞:數(shù)據(jù)挖掘;裝備質(zhì)量信息分析處理;因果分析;關(guān)聯(lián)分析;數(shù)據(jù)處理
裝備質(zhì)量信息是裝備在設(shè)計(jì)、生產(chǎn)制造、使用、維護(hù)等各階段與質(zhì)量相關(guān)的信息,貫穿于裝備的整個(gè)生命周期,反映裝備質(zhì)量要求、狀態(tài)、變化和相關(guān)要素及其相互關(guān)系。裝備在全壽命周期內(nèi),質(zhì)量特性會(huì)伴隨使用過(guò)程呈現(xiàn)逐漸退化的趨勢(shì),部分裝備則會(huì)出現(xiàn)顯性故障。由于裝備全壽命周期內(nèi)的質(zhì)量影響因素復(fù)雜多變,造成其質(zhì)量退化特性和故障規(guī)律難以把握。
事實(shí)上,全壽命周期內(nèi)除了研制階段,在使用階段還會(huì)積累大量使用過(guò)程中產(chǎn)生的質(zhì)量相關(guān)信息,例如:裝備貯存、勤務(wù)、使用、維修等方面的信息,在這些大量的裝備質(zhì)量相關(guān)信息中蘊(yùn)含著裝備質(zhì)量退化特性、故障規(guī)律等關(guān)聯(lián)信息,如果加以充分利用,將對(duì)裝備質(zhì)量管理提供有力支持。傳統(tǒng)的數(shù)據(jù)分析方法可大致分為基于時(shí)間維度的分析方法、基于概率統(tǒng)計(jì)的分析方法和基于失效物理的分析方法。
數(shù)據(jù)挖掘評(píng)職知識(shí):數(shù)據(jù)挖掘工程師發(fā)表論文期刊推薦
此類(lèi)方法的共同點(diǎn)是需要對(duì)原始數(shù)據(jù)進(jìn)行抽樣,得到數(shù)據(jù)樣本,從有限的樣本空間中尋找出特征和規(guī)律,追求算法的復(fù)雜性和準(zhǔn)確性。大數(shù)據(jù)分析方法直接對(duì)全體數(shù)據(jù)進(jìn)行分析而不需要數(shù)據(jù)樣本,所面對(duì)的數(shù)據(jù)量大大增加,更追求算法的高效性,應(yīng)降低算法復(fù)雜度,提高運(yùn)行速度,盡可能采用精簡(jiǎn)高效的模式對(duì)數(shù)據(jù)集進(jìn)行分析。大數(shù)據(jù)分析方法和傳統(tǒng)數(shù)據(jù)分析方法的區(qū)別主要體現(xiàn)在分析對(duì)象和算法的要求上,而且傳統(tǒng)數(shù)據(jù)分析方法還存在數(shù)據(jù)樣本規(guī)模涵蓋不全面影響分析結(jié)果的問(wèn)題。大數(shù)據(jù)運(yùn)用是繼云計(jì)算和物聯(lián)網(wǎng)之后信息技術(shù)領(lǐng)域又一次重大科技變革。
但是面對(duì)數(shù)據(jù)的巨量增加、數(shù)據(jù)種類(lèi)繁多和數(shù)據(jù)格式迥異,如何從海量數(shù)據(jù)中獲取有價(jià)值的信息,成為了大數(shù)據(jù)運(yùn)用的核心問(wèn)題。作為一種對(duì)數(shù)據(jù)高效處理和全面利用的技術(shù),數(shù)據(jù)挖掘技術(shù)是應(yīng)對(duì)上述挑戰(zhàn)的有效手段之一。應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行裝備質(zhì)量信息分析處理,能夠從大量數(shù)據(jù)集中發(fā)掘出有價(jià)值的知識(shí)、規(guī)則或高層次的信息,將為裝備質(zhì)量信息資源利用奠定基礎(chǔ),為破解裝備保障相關(guān)問(wèn)題與提升裝備管理保障科學(xué)化水平發(fā)揮重要作用。
1 裝備質(zhì)量信息分析
處理研究?jī)?nèi)容裝備質(zhì)量信息是組織實(shí)施裝備質(zhì)量管理的基礎(chǔ),也是進(jìn)行裝備使用、維修、保障以及改進(jìn)裝備設(shè)計(jì)的重要依據(jù)。美軍從上世紀(jì) 50 年代起就已經(jīng)認(rèn)識(shí)到裝備質(zhì)量信息管理的重要性,由國(guó)防部依托綜合數(shù)據(jù)交換網(wǎng)進(jìn)行全國(guó)性的裝備質(zhì)量信息管理,各軍種和軍事基地建立信息系統(tǒng),提供裝備全壽命周期各階段的相關(guān)數(shù)據(jù)。
國(guó)內(nèi)相關(guān)研究工作也取得了許多成果,余磊運(yùn)用本體技術(shù)實(shí)現(xiàn)了裝備 PHM信息的標(biāo)準(zhǔn)化描述,解決了信息異構(gòu)問(wèn)題,研究了裝備 PHM 領(lǐng)域本體語(yǔ)義推理和本體檢索技術(shù),在此基礎(chǔ)上設(shè)計(jì)并建立了信息共享系統(tǒng),實(shí)現(xiàn)了裝備PHM 信息共享[1]。準(zhǔn)確掌握裝備的性能質(zhì)量狀況是完成作戰(zhàn)任務(wù)的重要前提。
由于傳統(tǒng)裝備性能質(zhì)量評(píng)估方法存在效率較低、主觀因素影響大等問(wèn)題,黃睿等提出運(yùn)用系統(tǒng)工程理論及分析方法設(shè)計(jì)某型導(dǎo)彈性能質(zhì)量評(píng)估系統(tǒng),結(jié)合導(dǎo)彈質(zhì)量信息,實(shí)現(xiàn)了性能質(zhì)量的評(píng)估與預(yù)測(cè)[2]。裝備質(zhì)量信息分析處理的研究?jī)?nèi)容可分為因果分析、關(guān)聯(lián)分析、數(shù)據(jù)處理幾個(gè)方面。因果分析是縱向的,能夠從結(jié)果中探尋原因或者由原因預(yù)測(cè)結(jié)果;關(guān)聯(lián)分析是橫向的,得到的是事物之間的相互作用和相互影響,從不同的維度分析裝備質(zhì)量數(shù)據(jù)可以更準(zhǔn)確清晰地發(fā)掘其背后隱藏的知識(shí),必要的數(shù)據(jù)處理能夠提高數(shù)據(jù)質(zhì)量,保證發(fā)掘過(guò)程的順利實(shí)施。
1.1 質(zhì)量信息因果分析
裝備質(zhì)量信息因果分析主要包括故障診斷、故障預(yù)測(cè)和剩余使用壽命預(yù)測(cè)等內(nèi)容。故障診斷的實(shí)質(zhì)是故障檢測(cè)和故障隔離的過(guò)程,目的是對(duì)裝備發(fā)生故障的類(lèi)型、部位和原因進(jìn)行診斷;谀P偷墓收显\斷方法需要依據(jù)先驗(yàn)知識(shí)分析裝備部組件以及分系統(tǒng)之間的聯(lián)系,為其建立相對(duì)準(zhǔn)確的數(shù)學(xué)物理模型,從而實(shí)現(xiàn)對(duì)整個(gè)系統(tǒng)的狀態(tài)監(jiān)測(cè)和故障診斷[3]。
數(shù)據(jù)驅(qū)動(dòng)的故障診斷技術(shù)運(yùn)用多種不同的數(shù)據(jù)挖掘方法從海量的運(yùn)行數(shù)據(jù)中提取和分類(lèi)故障特征,不依賴系統(tǒng)的先驗(yàn)知識(shí)和準(zhǔn)確的數(shù)學(xué)物理模型,能更好地適應(yīng)新一代武器系統(tǒng)發(fā)展需要,因此近年來(lái)這方面的研究取得了許多成果。數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法包括基于多元統(tǒng)計(jì)的方法、基于深度學(xué)習(xí)的方法、基于信號(hào)處理的方法以及基于定量 AI 模型的方法。故障預(yù)測(cè)是為了預(yù)測(cè)裝備的運(yùn)行趨勢(shì),為維修策略的制定提供支持。
目前常用的故障預(yù)測(cè)方法可分為定性預(yù)測(cè)和定量預(yù)測(cè),其中定量預(yù)測(cè)包括基于數(shù)據(jù)的預(yù)測(cè)和基于模型的預(yù)測(cè);谀P偷姆椒ㄐ枰⑤^為準(zhǔn)確的數(shù)學(xué)模型,不適用于復(fù)雜裝備;谥R(shí)的方法中最具代表性的是專(zhuān)家系統(tǒng),由于知識(shí)難以自動(dòng)獲取且開(kāi)發(fā)周期較長(zhǎng),其應(yīng)用范圍受到限制[4]。基于數(shù)據(jù)的方法旨在利用裝備運(yùn)行過(guò)程中產(chǎn)生的大量數(shù)據(jù)提取信息,不需要確定的數(shù)學(xué)模型,適用性較強(qiáng),而且能用于彌補(bǔ)專(zhuān)家系統(tǒng)存在的缺陷[5],此類(lèi)方法包括深度學(xué)習(xí)、灰色模型、極限學(xué)習(xí)機(jī)、隨機(jī)森林等。
剩余使用壽命是系統(tǒng)或部件可繼續(xù)正常使用的時(shí)間長(zhǎng)度,剩余使用壽命預(yù)測(cè)技術(shù)是裝備 PHM的關(guān)鍵技術(shù)。剩余使用壽命預(yù)測(cè)方法分為基于模型的預(yù)測(cè)方法和基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法這兩類(lèi);谀P偷姆椒y以建立復(fù)雜裝備的退化模型,不適用于描述其退化過(guò)程,此類(lèi)方法主要有粒子濾波、卡爾曼濾波等[6];跀(shù)據(jù)驅(qū)動(dòng)的方法不需要對(duì)象的先驗(yàn)知識(shí),以裝備各個(gè)階段的測(cè)試數(shù)據(jù)、傳感器歷史數(shù)據(jù)為基礎(chǔ),經(jīng)過(guò)分析得到數(shù)據(jù)和剩余使用壽命之間的映射關(guān)系,此類(lèi)方法包括卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)和自編碼器等[7 8]。
1.2 質(zhì)量信息關(guān)聯(lián)分析
裝備質(zhì)量信息關(guān)聯(lián)分析主要包括參數(shù)關(guān)聯(lián)分析、裝備性能退化因素分析和裝備故障關(guān)聯(lián)分析等內(nèi)容。參數(shù)關(guān)聯(lián)分析的目的是找出裝備之間或者質(zhì)量參數(shù)與性能指標(biāo)之間的聯(lián)系,例如,導(dǎo)彈裝備的“存儲(chǔ)溫度”和“存儲(chǔ)時(shí)間長(zhǎng)度”可能會(huì)共同對(duì)“陀螺轉(zhuǎn)速”產(chǎn)生影響,這種關(guān)系是很難從質(zhì)量數(shù)據(jù)中直接判斷的,如何發(fā)現(xiàn)這些關(guān)聯(lián)關(guān)系需要深入研究。帥勇等人利用 FP Growth 算法構(gòu)建了文本數(shù)據(jù)的FP Tree,推理出了某型裝甲裝備動(dòng)力系統(tǒng)關(guān)鍵參數(shù)之間的關(guān)聯(lián)關(guān)系,提出了基于綜合模型的可靠性參數(shù)選擇算法[9]。王魁提出的測(cè)試參數(shù)體系分析技術(shù),梳理了導(dǎo)彈裝備各級(jí)組成間測(cè)試參數(shù)的關(guān)聯(lián),優(yōu)化了測(cè)試方案,提高了測(cè)試覆蓋程度[10]。裝備性能退化是武器裝備在使用過(guò)程中,部分性能指標(biāo)隨著時(shí)間的推移而逐漸下降的過(guò)程。性能退化因素分析的目的是探尋裝備性能退化的影響因素,如外部環(huán)境變化、內(nèi)在特性變化等。
裝備性能退化分析的方法可分為失效物理建模方法和數(shù)據(jù)驅(qū)動(dòng)建模方法兩類(lèi)。失效物理建模方法需要分析失效機(jī)理,根據(jù)物理或化學(xué)反應(yīng)規(guī)律建立基于失效物理的退化模型,應(yīng)用較為廣泛的模型有反應(yīng)論模型[11]和累積損傷模型[12]。數(shù)據(jù)驅(qū)動(dòng)建模方法直接從裝備性能測(cè)試數(shù)據(jù)和狀態(tài)監(jiān)測(cè)數(shù)據(jù)中挖掘出隱含的性能演變規(guī)律,而不用考慮裝備內(nèi)部的退化失效機(jī)制,此類(lèi)方法包括退化軌跡方法[13]、隨機(jī)過(guò)程方法[14]等。故障關(guān)聯(lián)分析能夠?qū)ふ已b備故障之間的關(guān)聯(lián)關(guān)系,發(fā)現(xiàn)關(guān)鍵部位之間的故障伴生規(guī)律。
國(guó)內(nèi)外專(zhuān)家學(xué)者在這方面開(kāi)展了相關(guān)研究,如基于 N 1 校驗(yàn)的故障相關(guān)性網(wǎng)絡(luò)、基于事故鏈信息的故障關(guān)聯(lián)矩陣、電機(jī)故障關(guān)聯(lián)分析等[15]。對(duì)于復(fù)雜裝備,常用的故障檢測(cè)方法往往只能得到相對(duì)獨(dú)立的故障信息,無(wú)法獲悉其中隱含的關(guān)聯(lián)關(guān)系,運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)大量故障數(shù)據(jù)開(kāi)展相關(guān)性分析是解決這一問(wèn)題的有效途徑。文獻(xiàn)[16]提出了一種航空設(shè)備故障關(guān)聯(lián)分析方法,將 Apriori 算法用于挖掘航空設(shè)備故障關(guān)聯(lián)關(guān)系并進(jìn)行了驗(yàn)證。
1.3 裝備質(zhì)量數(shù)據(jù)處理
裝備質(zhì)量數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)、數(shù)據(jù)離散化等內(nèi)容。數(shù)據(jù)清洗起初是為了解決美國(guó)社會(huì)保險(xiǎn)號(hào)碼的糾錯(cuò)問(wèn)題,現(xiàn)如今已經(jīng)在許多領(lǐng)域得到了應(yīng)用。隨著軍隊(duì)信息化建設(shè)的不斷推進(jìn),人們能夠在裝備全壽命周期內(nèi)獲取越來(lái)越多的質(zhì)量相關(guān)信息。在獲得這些數(shù)據(jù)之后,通過(guò)數(shù)據(jù)挖掘技術(shù)希望能從中抽取出有價(jià)值的知識(shí)。為了得到滿足裝備管理需求的有價(jià)值的信息,就要求所獲得的數(shù)據(jù)具有可靠性,同時(shí)能夠準(zhǔn)確反映裝備實(shí)際情況。
但事實(shí)上,人們獲得的第一手?jǐn)?shù)據(jù)往往含有噪聲,如果不預(yù)先進(jìn)行清洗處理,其中不準(zhǔn)確數(shù)據(jù)、異常數(shù)據(jù)以及人為造成的錯(cuò)誤數(shù)據(jù)等可能影響數(shù)據(jù)挖掘效果甚至最終結(jié)論的準(zhǔn)確性。沈小軍等提出的風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)清洗方法根據(jù)拉依達(dá)準(zhǔn)則,將服從正態(tài)分布的數(shù)據(jù)中超過(guò)3倍標(biāo)準(zhǔn)差的數(shù)據(jù)值視為異常值進(jìn)行消除[17]。
文獻(xiàn)[18]提出運(yùn)用決策樹(shù)分類(lèi)模型來(lái)實(shí)現(xiàn)數(shù)據(jù)清洗,相對(duì)于傳統(tǒng)的數(shù)據(jù)清洗算法在性能上得到了提高。四分位法根據(jù)實(shí)測(cè)數(shù)據(jù)進(jìn)行離群值分析處理,實(shí)現(xiàn)異常數(shù)據(jù)清洗,但此方法在異常數(shù)據(jù)比重較大時(shí)識(shí)別效果不佳[19]。處理大量異常數(shù)據(jù)時(shí)可采用支持向量回歸算法,其核心是用函數(shù)擬合數(shù)據(jù)[20]。K means算法能夠?qū)崿F(xiàn)異常數(shù)據(jù)的快速識(shí)別,且具有較好的準(zhǔn)確性[21]。
K 最近鄰算法及其改進(jìn)方法對(duì)于數(shù)據(jù)缺失值的處理具有較好的效果[22]。實(shí)際采樣收集到的裝備運(yùn)行狀態(tài)數(shù)據(jù)中,正常數(shù)據(jù)樣本量大,而故障數(shù)據(jù)樣本量小且對(duì)應(yīng)的各種故障類(lèi)型樣本分布不均衡。樣本數(shù)據(jù)的不平衡特性將嚴(yán)重影響基于數(shù)據(jù)驅(qū)動(dòng)方法的有效性。
為實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的武器系統(tǒng)電子元部件級(jí)故障診斷技術(shù)的工程應(yīng)用,解決數(shù)據(jù)質(zhì)量問(wèn)題,楊華暉研究了電子元部件故障小樣本數(shù)據(jù)的增強(qiáng)方法,建立了基于生成式對(duì)抗網(wǎng)絡(luò)的故障小樣本數(shù)據(jù)增強(qiáng)模型,提出了基于多標(biāo)簽一維 AC GAN 的數(shù)據(jù)增強(qiáng)方法,并以電壓整流器晶體管故障為例進(jìn)行了驗(yàn)證[23]。裝備質(zhì)量相關(guān)數(shù)據(jù)中包括部分連續(xù)量,故數(shù)據(jù)離散化也是必不可少的數(shù)據(jù)準(zhǔn)備環(huán)節(jié)之一。離散化是將連續(xù)的值域劃分為若干個(gè)區(qū)間,每個(gè)區(qū)間對(duì)應(yīng)一個(gè)值,最后將連續(xù)數(shù)據(jù)轉(zhuǎn)化為離散量。
離散化數(shù)據(jù)對(duì)存儲(chǔ)空間的需求較小,形式更簡(jiǎn)潔,能夠保證一些數(shù)據(jù)挖掘方法的順利運(yùn)行,提高數(shù)據(jù)挖掘的效率。離散化算法主要有:PKID 算法,近似等頻離散化算法,基于聚類(lèi)的離散化算法,ChiMerge 算法,基于粗糙集的離散化算法,CAIM 算法[24 25]。一些專(zhuān)家學(xué)者在開(kāi)展自身科研工作的同時(shí),對(duì)所涉及的數(shù)據(jù)處理方法也進(jìn)行了研究改進(jìn)。袁浩恒提出了一種并行比較并獲得最優(yōu)離散化的數(shù)據(jù)準(zhǔn)備算法,針對(duì)不同數(shù)據(jù)集,先進(jìn)行特性檢測(cè)以獲得其分布特性,按照分布特性進(jìn)行數(shù)據(jù)集的異常值檢測(cè)和剔除,并行完成與分布特性適配的離散化方法處理[26]。
白堂博等人在文獻(xiàn)[27]中指出了傳統(tǒng)的均勻區(qū)段劃分法、加權(quán)劃分法和模糊指數(shù)法等離散化方法存在的問(wèn)題,提出了基于符號(hào)聚合近似的關(guān)聯(lián)規(guī)則挖掘方法,對(duì)振動(dòng)信號(hào)進(jìn)行特征提取之后利用符號(hào)聚合近似方法進(jìn)行數(shù)據(jù)離散化。從裝備質(zhì)量信息分析處理的研究現(xiàn)狀來(lái)看,裝備質(zhì)量信息因果分析與關(guān)聯(lián)分析所采用的方法可大致分為基于模型的方法和基于數(shù)據(jù)的方法這兩類(lèi);谀P偷姆椒ㄡ槍(duì)特定型號(hào)的裝備時(shí)分析結(jié)果較為精確,但其對(duì)系統(tǒng)先驗(yàn)知識(shí)要求較高,難以滿足復(fù)雜裝備的需求。
基于數(shù)據(jù)的方法不依賴裝備先驗(yàn)知識(shí),方法適用性較強(qiáng),不局限于特定對(duì)象,能更好適應(yīng)新型裝備結(jié)構(gòu)復(fù)雜、系統(tǒng)內(nèi)部關(guān)聯(lián)緊密的特點(diǎn),但其訓(xùn)練周期較長(zhǎng),且對(duì)信號(hào)與數(shù)據(jù)要求更高。裝備質(zhì)量數(shù)據(jù)處理的研究相對(duì)較少,仍有一些問(wèn)題有待解決,數(shù)據(jù)清洗面臨異常數(shù)據(jù)處理不充分與隱藏有用信息過(guò)度剔除之間的矛盾;提高數(shù)據(jù)質(zhì)量是數(shù)據(jù)驅(qū)動(dòng)方法實(shí)現(xiàn)工程應(yīng)用的基礎(chǔ)性研究,面對(duì)海量裝備質(zhì)量數(shù)據(jù)時(shí)仍存在較大困難;數(shù)據(jù)離散化仍面臨離散化過(guò)度、離散化質(zhì)量不高、有用信息丟失等問(wèn)題。
2 數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中獲取有用信息的過(guò)程,其實(shí)質(zhì)是綜合應(yīng)用各種技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理和訓(xùn)練,得到能夠反映輸出數(shù)據(jù)與輸入數(shù)據(jù)之間關(guān)系的模型。根據(jù)解決的問(wèn)題和處理數(shù)據(jù)的方式,數(shù)據(jù)挖掘的方法可以分為回歸、分類(lèi)、聚類(lèi)、關(guān)聯(lián)規(guī)則、預(yù)測(cè)和離群點(diǎn)檢測(cè)這六大類(lèi)。回歸是確定兩種以上參數(shù)之間定量關(guān)系的一種統(tǒng)計(jì)分析方法。
根據(jù)因變量的個(gè)數(shù)或者回歸函數(shù)的類(lèi)型可將回歸方法分為一元線性回歸、一元非線性回歸、多元線性回歸、多元非線性回歸這幾類(lèi),此外,逐步回歸方法[28]和 Logistic 回歸方法[29]也是常用的回歸方法;貧w可用于裝備故障預(yù)測(cè)、剩余壽命預(yù)測(cè)、性能評(píng)估、數(shù)據(jù)清洗等研究,適合定量分析,回歸方法的選用比較靈活。分類(lèi)是通過(guò)分析已知類(lèi)別的訓(xùn)練集得到分類(lèi)規(guī)則,再用分類(lèi)規(guī)則為新的數(shù)據(jù)劃分類(lèi)別的方法。
目前分類(lèi)方法的研究成果主要包括:決策樹(shù)方法、BP 神經(jīng)網(wǎng)絡(luò)方法、貝葉斯分類(lèi)、K 近鄰算法、判別分析、支持向量機(jī)等[30 32]。分類(lèi)方法可用于故障診斷、壽命預(yù)測(cè)、裝備作戰(zhàn)效能評(píng)估、機(jī)內(nèi)測(cè)試技術(shù)等研究,不同的分類(lèi)方法各有優(yōu)劣,每一種方法都有特定的應(yīng)用領(lǐng)域,但是通常只適合解決某一類(lèi)問(wèn)題。聚類(lèi)是將原本沒(méi)有類(lèi)別的對(duì)象聚集成由類(lèi)似的對(duì)象集合組成的若干個(gè)類(lèi)或者簇的過(guò)程。
目前聚類(lèi)算法可以分為層次聚類(lèi)、劃分聚類(lèi)、基于模型的聚類(lèi)、基于網(wǎng)格的聚類(lèi)和基于密度的聚類(lèi)這幾類(lèi),其中實(shí)踐應(yīng)用較多的是 K means、神經(jīng)網(wǎng)絡(luò)聚類(lèi)、模糊 C 均值聚類(lèi)、層次聚類(lèi)、高斯聚類(lèi)等方法[33 35]。聚類(lèi)可用于故障診斷、裝備維修輔助決策、維修性分析、數(shù)據(jù)離散化等研究。關(guān)聯(lián)規(guī)則挖掘是發(fā)現(xiàn)數(shù)據(jù)項(xiàng)集之間關(guān)聯(lián)關(guān)系的過(guò)程,常見(jiàn)的算法有 Apriori 算法[36]和 FP Growth算法[37]。關(guān)聯(lián)規(guī)則被廣泛應(yīng)用于裝備故障關(guān)聯(lián)分析、性能退化因素分析、可靠性工程等研究中,對(duì)于隱藏知識(shí)的發(fā)掘具有優(yōu)勢(shì),但面對(duì)較大規(guī)模的數(shù)據(jù)集時(shí),其效率不夠理想。
數(shù)據(jù)挖掘中的預(yù)測(cè)是依據(jù)現(xiàn)有的數(shù)據(jù)建立數(shù)學(xué)模型,從而對(duì)未來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。預(yù)測(cè)方法有灰色預(yù)測(cè)[38]、馬爾科夫預(yù)測(cè)[39]、回歸方法[40]、神經(jīng)網(wǎng)絡(luò)[41]、最小二乘法[42]、平滑預(yù)測(cè)法[43]、自回歸模型[44]、自回歸移動(dòng)平均模型[45]等。預(yù)測(cè)適用于裝備故障預(yù)測(cè)、剩余壽命預(yù)測(cè)等研究,優(yōu)點(diǎn)是能夠定量地描述事物的變化程度,依據(jù)歷史數(shù)據(jù)而不受主觀因素影響,缺點(diǎn)是靈活性不夠,不適合處理變化較大的數(shù)據(jù)。離群點(diǎn)是數(shù)據(jù)集中的少量異常數(shù)據(jù),可能是噪聲數(shù)據(jù),但也可能包含有用信息,離群點(diǎn)檢測(cè)的目的是發(fā)現(xiàn)這些隱藏的知識(shí)。
經(jīng)典的檢測(cè)方法可以分為基于統(tǒng)計(jì)學(xué)的方法、基于距離或鄰近度的方法、基于密度的方法和基于聚類(lèi)的方法。離群點(diǎn)檢測(cè)通常用于數(shù)據(jù)處理,提高數(shù)據(jù)分析的準(zhǔn)確性。近些年離群點(diǎn)檢測(cè)的方法研究取得了一定進(jìn)展。對(duì)于裝備質(zhì)量信息分析處理涉及的不同內(nèi)容,都有其適用的數(shù)據(jù)挖掘方法,質(zhì)量信息因果分析適合采用回歸、分類(lèi)、預(yù)測(cè)或離群點(diǎn)檢測(cè)方法,質(zhì)量信息關(guān)聯(lián)分析主要運(yùn)用關(guān)聯(lián)規(guī)則,裝備質(zhì)量數(shù)據(jù)處理適用聚類(lèi)、分類(lèi)、回歸或離群點(diǎn)檢測(cè)方法。
3 面臨的問(wèn)題及未來(lái)研究方向
我軍針對(duì)裝備質(zhì)量信息分析已開(kāi)展了一定的研究工作。在因果分析方面,故障診斷的相關(guān)研究較為廣泛和深入,不論是技術(shù)方法的探索還是體系框架的構(gòu)建都取得了豐碩成果,提高復(fù)雜裝備故障診斷的準(zhǔn)確度是需要重點(diǎn)解決的問(wèn)題,智能診斷、綜合診斷等是近些年的研究熱點(diǎn)。故障預(yù)測(cè)的相關(guān)研究更傾向于技術(shù)與方法的改進(jìn),在航空裝備上得到了更為廣泛的應(yīng)用。
剩余壽命預(yù)測(cè)通常將裝備中某個(gè)分系統(tǒng)或零部件如發(fā)動(dòng)機(jī)、傳感器、電池、軸承等作為研究對(duì)象,對(duì)于具體問(wèn)題的研究程度較深。在關(guān)聯(lián)分析方面,參數(shù)關(guān)聯(lián)分析和裝備性能退化因素分析的研究相對(duì)較少,主要開(kāi)展算法優(yōu)化或者建立模型等工作,故障關(guān)聯(lián)分析受到的關(guān)注較多,其應(yīng)用也更廣泛,研究人員依據(jù)不同的對(duì)象提出了許多有效的方法。
在數(shù)據(jù)處理方面,數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)、數(shù)據(jù)離散化等通常是為滿足特定需求而實(shí)施的,專(zhuān)門(mén)的研究較少,仍有較大發(fā)展空間。隨著我軍現(xiàn)代化建設(shè)的不斷推進(jìn),新一代武器系統(tǒng)得到了更為廣泛的運(yùn)用,新型裝備全壽命周期內(nèi)的質(zhì)量影響因素復(fù)雜多變,使得其質(zhì)量退化特性和故障規(guī)律難以把握。傳統(tǒng)的定期維修、視情維修等方法在故障診斷的準(zhǔn)確性、故障檢測(cè)與排除的及時(shí)性、保障效率以及維護(hù)成本等方面存在一定的弊端,難以適應(yīng)新形勢(shì)下裝備保障需求的發(fā)展。
依托“裝備云”等平臺(tái),利用數(shù)據(jù)挖掘技術(shù)進(jìn)行裝備質(zhì)量信息的分析處理為解決這些現(xiàn)實(shí)矛盾,提高裝備質(zhì)量問(wèn)題分析能力、裝備質(zhì)量評(píng)估能力和裝備預(yù)防性維修能力開(kāi)辟了新的途徑,為提升裝備管理保障的科學(xué)化水平提供了有力支持[46 48]。對(duì)于數(shù)據(jù)分析,目前我軍采用的方法包括深度神經(jīng)網(wǎng)絡(luò)、偏相關(guān)分析、關(guān)聯(lián)規(guī)則分析、大數(shù)據(jù)分析等[49 51]。
3.1 面臨的問(wèn)題
目前,一些專(zhuān)家學(xué)者已經(jīng)將數(shù)據(jù)挖掘技術(shù)運(yùn)用于裝備質(zhì)量管理知識(shí)發(fā)現(xiàn)、裝備使用質(zhì)量信息分析、裝備故障智能診斷方法、裝備設(shè)計(jì)質(zhì)量綜合評(píng)估方法、裝備故障診斷系統(tǒng)等領(lǐng)域的研究,并提出了裝備質(zhì)量信息分析處理的構(gòu)想,初步建立了基于數(shù)據(jù)挖掘的裝備使用質(zhì)量信息管理系統(tǒng)框架,探索了裝備故障診斷的方法,對(duì)數(shù)據(jù)挖掘算法開(kāi)展了深入研究。但是,利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)裝備質(zhì)量信息分析處理還面臨一些問(wèn)題:
1)數(shù)據(jù)挖掘是涉及機(jī)器學(xué)習(xí)、人工智能、數(shù)據(jù)庫(kù)理論以及統(tǒng)計(jì)學(xué)等學(xué)科的交叉研究領(lǐng)域,將數(shù)據(jù)挖掘技術(shù)用于裝備質(zhì)量信息分析處理的研究具有一定的難度,而且部隊(duì)相關(guān)條件建設(shè)還不夠完善,如“裝備云”等平臺(tái)仍處于規(guī)劃和發(fā)展階段,因此,目前研究將數(shù)據(jù)挖掘技術(shù)運(yùn)用于裝備質(zhì)量信息分析處理的學(xué)者較少,F(xiàn)有的研究主要是提出系統(tǒng)框架設(shè)計(jì)方案或者提供研究思路,在問(wèn)題的解決方法和具體實(shí)踐工作方面比較欠缺。
2)許多專(zhuān)家學(xué)者對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行了深入的研究,取得了豐碩的成果。經(jīng)典的數(shù)據(jù)挖掘方法思路簡(jiǎn)單且技術(shù)成熟,但是挖掘效率不高,如果參與挖掘的裝備質(zhì)量相關(guān)數(shù)據(jù)涉及的項(xiàng)目較多,效果可能不理想,將影響復(fù)雜裝備質(zhì)量問(wèn)題分析能力。改進(jìn)算法種類(lèi)繁多,不同算法的設(shè)計(jì)理念與實(shí)現(xiàn)思路各異,在特定的應(yīng)用背景下具有良好的運(yùn)行效果,但相關(guān)研究不夠成熟,對(duì)于解決其他問(wèn)題是否同樣適用需要論證。
3)數(shù)據(jù)處理是解決原始數(shù)據(jù)存在問(wèn)題,保證數(shù)據(jù)挖掘順利進(jìn)行的重要步驟。目前有些與數(shù)據(jù)挖掘相關(guān)的文獻(xiàn)對(duì)數(shù)據(jù)準(zhǔn)備階段工作的論述和數(shù)據(jù)處理方法的研究比較欠缺。一些學(xué)者用于挖掘的數(shù)據(jù)不是原始數(shù)據(jù),但未將數(shù)據(jù)準(zhǔn)備納入到研究范圍內(nèi),而是用人工方法轉(zhuǎn)換了部分?jǐn)?shù)據(jù),在數(shù)據(jù)量較大或者數(shù)據(jù)質(zhì)量不高時(shí)效率較低。對(duì)于數(shù)據(jù)清洗的理論研究還不夠成熟,不同的數(shù)據(jù)離散化方法對(duì)于裝備數(shù)據(jù)挖掘的適應(yīng)性有待驗(yàn)證。
3.2 未來(lái)研究方向
目前,基于數(shù)據(jù)挖掘的裝備質(zhì)量信息分析處理技術(shù)研究仍有許多工作亟待完成,未來(lái)研究方向主要體現(xiàn)在以下幾個(gè)方面:
1)裝備質(zhì)量相關(guān)數(shù)據(jù)是質(zhì)量信息分析處理的基礎(chǔ)。裝備全壽命周期內(nèi)積累的大量信息通常以多種形式存在,例如以結(jié)構(gòu)化數(shù)據(jù)形式存在的數(shù)據(jù)表格、以半結(jié)構(gòu)化數(shù)據(jù)形式存在的自描述性文本、以非機(jī)構(gòu)化數(shù)據(jù)形式存在的描述性文字等。對(duì)于特定類(lèi)型的裝備,針對(duì)其質(zhì)量監(jiān)控和壽命評(píng)估、作戰(zhàn)使用及延壽整修決策需要,甄別篩選與裝備質(zhì)量相關(guān)的數(shù)據(jù),歸納提煉形成質(zhì)量信息集,構(gòu)建全壽命質(zhì)量信息數(shù)據(jù)體系。2)根據(jù)裝備質(zhì)量數(shù)據(jù)挖掘工作需要,研究針對(duì)不同問(wèn)題的數(shù)據(jù)清洗方法和具有普遍適用性與高效率的數(shù)據(jù)離散化算法,提高裝備質(zhì)量數(shù)據(jù)處理效果。
3)運(yùn)用云技術(shù),研究特定型號(hào)裝備全壽命質(zhì)量數(shù)據(jù)資源建設(shè)。結(jié)合在貯存、使用、勤務(wù)、維修等環(huán)節(jié)質(zhì)量數(shù)據(jù)的生成特點(diǎn),研究終端節(jié)點(diǎn)裝備質(zhì)量數(shù)據(jù)的采集、存儲(chǔ)和管理機(jī)制,利用云存儲(chǔ)的分布式優(yōu)勢(shì),實(shí)現(xiàn)數(shù)據(jù)的終端采集,云端處理。
4)結(jié)合裝備質(zhì)量數(shù)據(jù)的特點(diǎn),立足部隊(duì)裝備管理實(shí)際需求,利用關(guān)聯(lián)規(guī)則挖掘方法,發(fā)掘出質(zhì)量參數(shù)之間的關(guān)聯(lián)關(guān)系,運(yùn)用分類(lèi)、預(yù)測(cè)等數(shù)據(jù)挖掘方法,分析裝備質(zhì)量退化原因及故障發(fā)生規(guī)律。研究裝備質(zhì)量信息挖掘方法,評(píng)估算法的適應(yīng)性并設(shè)法改進(jìn)。優(yōu)化方法方面可以在與其他算法、技術(shù)進(jìn)行融合或各種改進(jìn)方式綜合使用上取得突破。5)依托數(shù)據(jù)挖掘技術(shù)和云技術(shù),打破傳統(tǒng)的層級(jí)式保障模式,探索裝備全壽命質(zhì)量信息資源應(yīng)用機(jī)制與方法。根據(jù)不同應(yīng)用場(chǎng)景和功能需求,構(gòu)建云終端應(yīng)用,設(shè)置終端軟件,實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)查詢、數(shù)據(jù)處理、數(shù)據(jù)分析、質(zhì)量評(píng)估、維修預(yù)測(cè)等功能。
4 結(jié)束語(yǔ)
數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘出有用信息的過(guò)程,通過(guò)挖掘數(shù)據(jù)中隱含的信息,可以得到平時(shí)難以獲取的知識(shí)和事物背后隱藏的規(guī)律。基于數(shù)據(jù)挖掘的裝備質(zhì)量信息分析處理的實(shí)質(zhì)是運(yùn)用數(shù)據(jù)挖掘技術(shù)從大量裝備質(zhì)量相關(guān)數(shù)據(jù)中采掘出其中的關(guān)聯(lián)關(guān)系和因果關(guān)系,從而探尋裝備質(zhì)量退化特性和故障規(guī)律,充分發(fā)揮質(zhì)量數(shù)據(jù)的效用,進(jìn)而破除傳統(tǒng)裝備保障方法存在的弊端。
基于數(shù)據(jù)挖掘的裝備質(zhì)量信息分析處理技術(shù)為提高裝備質(zhì)量問(wèn)題分析能力、裝備質(zhì)量評(píng)估能力和裝備預(yù)防性維修能力拓展了思路,能夠?yàn)樘嵘b備管理保障的科學(xué)化水平提供有力支持。如何解決現(xiàn)有研究中面臨的問(wèn)題,使基于數(shù)據(jù)挖掘的裝備質(zhì)量信息分析處理技術(shù)在實(shí)際工程應(yīng)用中發(fā)揮更大作用,將是未來(lái)的重要研究方向。
參考文獻(xiàn)
[1] 余磊. 基于本體的裝備 PHM 信息共享技術(shù)研究[D].石家莊:陸軍工程大學(xué),2017.
[2] 黃睿,劉小方,鄭祥. 某型導(dǎo)彈性能質(zhì)量評(píng)估系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 火炮發(fā)射與控制學(xué)報(bào),2019,40(2):88 92
.[3] 蔡金燕,韓春輝,孟亞峰. Analog circuit testability forfault diagnosis[J]. Tsinghua Science andTechnology,2007,12(S1):270 274.
[4] HU LQ,HE CF,CAI ZQ,et al. Track circuit faultprediction method based on grey theory and expertsystem[J]. Journal of Visual Communication and ImageRepresentation,2019,58:37 45
.[5] 王亮,呂衛(wèi)民,滕克難,等. 基于數(shù)據(jù)驅(qū)動(dòng)的裝備故障預(yù)測(cè)技術(shù)研究 [J]. 計(jì)算機(jī)測(cè)量與控制,2013,21(8):2087 2089+2105.
[6] RAHIMI A,KUMAR K D,Alighanbari H. Failureprognosis for satellite reaction wheels using Kalman filterand particle filter[J]. Journal of Guidance,Control,andDynamics,2020,43(3):585 588.
作者:李馥林,孟晨,范書(shū)義
轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/29919.html