本文摘要:摘 要:對裝備質量信息進行分析和處理是準確掌握裝備性能狀態(tài),提高裝備保障水平的關鍵。隨著計算機技術與信息技術的不斷發(fā)展和大數(shù)據(jù)的運用,部隊亟需裝備質量信息分析處理技術以充分利用裝備質量數(shù)據(jù)資源,基于數(shù)據(jù)挖掘的裝備質量信息分析處理技術正逐漸成為裝備保障
摘 要:對裝備質量信息進行分析和處理是準確掌握裝備性能狀態(tài),提高裝備保障水平的關鍵。隨著計算機技術與信息技術的不斷發(fā)展和大數(shù)據(jù)的運用,部隊亟需裝備質量信息分析處理技術以充分利用裝備質量數(shù)據(jù)資源,基于數(shù)據(jù)挖掘的裝備質量信息分析處理技術正逐漸成為裝備保障領域的重要研究方向。從因果分析、關聯(lián)分析和數(shù)據(jù)處理幾個方面論述了裝備質量信息分析處理的研究內容,梳理了數(shù)據(jù)挖掘的方法,并闡述了國內外研究現(xiàn)狀。簡要分析了各類數(shù)據(jù)挖掘技術面向裝備質量信息分析處理不同研究點時的適用性。探討了基于數(shù)據(jù)挖掘的裝備質量信息分析處理面臨的主要問題及其未來發(fā)展方向。
關鍵詞:數(shù)據(jù)挖掘;裝備質量信息分析處理;因果分析;關聯(lián)分析;數(shù)據(jù)處理
裝備質量信息是裝備在設計、生產制造、使用、維護等各階段與質量相關的信息,貫穿于裝備的整個生命周期,反映裝備質量要求、狀態(tài)、變化和相關要素及其相互關系。裝備在全壽命周期內,質量特性會伴隨使用過程呈現(xiàn)逐漸退化的趨勢,部分裝備則會出現(xiàn)顯性故障。由于裝備全壽命周期內的質量影響因素復雜多變,造成其質量退化特性和故障規(guī)律難以把握。
事實上,全壽命周期內除了研制階段,在使用階段還會積累大量使用過程中產生的質量相關信息,例如:裝備貯存、勤務、使用、維修等方面的信息,在這些大量的裝備質量相關信息中蘊含著裝備質量退化特性、故障規(guī)律等關聯(lián)信息,如果加以充分利用,將對裝備質量管理提供有力支持。傳統(tǒng)的數(shù)據(jù)分析方法可大致分為基于時間維度的分析方法、基于概率統(tǒng)計的分析方法和基于失效物理的分析方法。
數(shù)據(jù)挖掘評職知識:數(shù)據(jù)挖掘工程師發(fā)表論文期刊推薦
此類方法的共同點是需要對原始數(shù)據(jù)進行抽樣,得到數(shù)據(jù)樣本,從有限的樣本空間中尋找出特征和規(guī)律,追求算法的復雜性和準確性。大數(shù)據(jù)分析方法直接對全體數(shù)據(jù)進行分析而不需要數(shù)據(jù)樣本,所面對的數(shù)據(jù)量大大增加,更追求算法的高效性,應降低算法復雜度,提高運行速度,盡可能采用精簡高效的模式對數(shù)據(jù)集進行分析。大數(shù)據(jù)分析方法和傳統(tǒng)數(shù)據(jù)分析方法的區(qū)別主要體現(xiàn)在分析對象和算法的要求上,而且傳統(tǒng)數(shù)據(jù)分析方法還存在數(shù)據(jù)樣本規(guī)模涵蓋不全面影響分析結果的問題。大數(shù)據(jù)運用是繼云計算和物聯(lián)網之后信息技術領域又一次重大科技變革。
但是面對數(shù)據(jù)的巨量增加、數(shù)據(jù)種類繁多和數(shù)據(jù)格式迥異,如何從海量數(shù)據(jù)中獲取有價值的信息,成為了大數(shù)據(jù)運用的核心問題。作為一種對數(shù)據(jù)高效處理和全面利用的技術,數(shù)據(jù)挖掘技術是應對上述挑戰(zhàn)的有效手段之一。應用數(shù)據(jù)挖掘技術進行裝備質量信息分析處理,能夠從大量數(shù)據(jù)集中發(fā)掘出有價值的知識、規(guī)則或高層次的信息,將為裝備質量信息資源利用奠定基礎,為破解裝備保障相關問題與提升裝備管理保障科學化水平發(fā)揮重要作用。
1 裝備質量信息分析
處理研究內容裝備質量信息是組織實施裝備質量管理的基礎,也是進行裝備使用、維修、保障以及改進裝備設計的重要依據(jù)。美軍從上世紀 50 年代起就已經認識到裝備質量信息管理的重要性,由國防部依托綜合數(shù)據(jù)交換網進行全國性的裝備質量信息管理,各軍種和軍事基地建立信息系統(tǒng),提供裝備全壽命周期各階段的相關數(shù)據(jù)。
國內相關研究工作也取得了許多成果,余磊運用本體技術實現(xiàn)了裝備 PHM信息的標準化描述,解決了信息異構問題,研究了裝備 PHM 領域本體語義推理和本體檢索技術,在此基礎上設計并建立了信息共享系統(tǒng),實現(xiàn)了裝備PHM 信息共享[1]。準確掌握裝備的性能質量狀況是完成作戰(zhàn)任務的重要前提。
由于傳統(tǒng)裝備性能質量評估方法存在效率較低、主觀因素影響大等問題,黃睿等提出運用系統(tǒng)工程理論及分析方法設計某型導彈性能質量評估系統(tǒng),結合導彈質量信息,實現(xiàn)了性能質量的評估與預測[2]。裝備質量信息分析處理的研究內容可分為因果分析、關聯(lián)分析、數(shù)據(jù)處理幾個方面。因果分析是縱向的,能夠從結果中探尋原因或者由原因預測結果;關聯(lián)分析是橫向的,得到的是事物之間的相互作用和相互影響,從不同的維度分析裝備質量數(shù)據(jù)可以更準確清晰地發(fā)掘其背后隱藏的知識,必要的數(shù)據(jù)處理能夠提高數(shù)據(jù)質量,保證發(fā)掘過程的順利實施。
1.1 質量信息因果分析
裝備質量信息因果分析主要包括故障診斷、故障預測和剩余使用壽命預測等內容。故障診斷的實質是故障檢測和故障隔離的過程,目的是對裝備發(fā)生故障的類型、部位和原因進行診斷。基于模型的故障診斷方法需要依據(jù)先驗知識分析裝備部組件以及分系統(tǒng)之間的聯(lián)系,為其建立相對準確的數(shù)學物理模型,從而實現(xiàn)對整個系統(tǒng)的狀態(tài)監(jiān)測和故障診斷[3]。
數(shù)據(jù)驅動的故障診斷技術運用多種不同的數(shù)據(jù)挖掘方法從海量的運行數(shù)據(jù)中提取和分類故障特征,不依賴系統(tǒng)的先驗知識和準確的數(shù)學物理模型,能更好地適應新一代武器系統(tǒng)發(fā)展需要,因此近年來這方面的研究取得了許多成果。數(shù)據(jù)驅動的故障診斷方法包括基于多元統(tǒng)計的方法、基于深度學習的方法、基于信號處理的方法以及基于定量 AI 模型的方法。故障預測是為了預測裝備的運行趨勢,為維修策略的制定提供支持。
目前常用的故障預測方法可分為定性預測和定量預測,其中定量預測包括基于數(shù)據(jù)的預測和基于模型的預測。基于模型的方法需要建立較為準確的數(shù)學模型,不適用于復雜裝備。基于知識的方法中最具代表性的是專家系統(tǒng),由于知識難以自動獲取且開發(fā)周期較長,其應用范圍受到限制[4];跀(shù)據(jù)的方法旨在利用裝備運行過程中產生的大量數(shù)據(jù)提取信息,不需要確定的數(shù)學模型,適用性較強,而且能用于彌補專家系統(tǒng)存在的缺陷[5],此類方法包括深度學習、灰色模型、極限學習機、隨機森林等。
剩余使用壽命是系統(tǒng)或部件可繼續(xù)正常使用的時間長度,剩余使用壽命預測技術是裝備 PHM的關鍵技術。剩余使用壽命預測方法分為基于模型的預測方法和基于數(shù)據(jù)驅動的預測方法這兩類。基于模型的方法難以建立復雜裝備的退化模型,不適用于描述其退化過程,此類方法主要有粒子濾波、卡爾曼濾波等[6];跀(shù)據(jù)驅動的方法不需要對象的先驗知識,以裝備各個階段的測試數(shù)據(jù)、傳感器歷史數(shù)據(jù)為基礎,經過分析得到數(shù)據(jù)和剩余使用壽命之間的映射關系,此類方法包括卷積神經網絡、循環(huán)神經網絡、深度置信網絡和自編碼器等[7 8]。
1.2 質量信息關聯(lián)分析
裝備質量信息關聯(lián)分析主要包括參數(shù)關聯(lián)分析、裝備性能退化因素分析和裝備故障關聯(lián)分析等內容。參數(shù)關聯(lián)分析的目的是找出裝備之間或者質量參數(shù)與性能指標之間的聯(lián)系,例如,導彈裝備的“存儲溫度”和“存儲時間長度”可能會共同對“陀螺轉速”產生影響,這種關系是很難從質量數(shù)據(jù)中直接判斷的,如何發(fā)現(xiàn)這些關聯(lián)關系需要深入研究。帥勇等人利用 FP Growth 算法構建了文本數(shù)據(jù)的FP Tree,推理出了某型裝甲裝備動力系統(tǒng)關鍵參數(shù)之間的關聯(lián)關系,提出了基于綜合模型的可靠性參數(shù)選擇算法[9]。王魁提出的測試參數(shù)體系分析技術,梳理了導彈裝備各級組成間測試參數(shù)的關聯(lián),優(yōu)化了測試方案,提高了測試覆蓋程度[10]。裝備性能退化是武器裝備在使用過程中,部分性能指標隨著時間的推移而逐漸下降的過程。性能退化因素分析的目的是探尋裝備性能退化的影響因素,如外部環(huán)境變化、內在特性變化等。
裝備性能退化分析的方法可分為失效物理建模方法和數(shù)據(jù)驅動建模方法兩類。失效物理建模方法需要分析失效機理,根據(jù)物理或化學反應規(guī)律建立基于失效物理的退化模型,應用較為廣泛的模型有反應論模型[11]和累積損傷模型[12]。數(shù)據(jù)驅動建模方法直接從裝備性能測試數(shù)據(jù)和狀態(tài)監(jiān)測數(shù)據(jù)中挖掘出隱含的性能演變規(guī)律,而不用考慮裝備內部的退化失效機制,此類方法包括退化軌跡方法[13]、隨機過程方法[14]等。故障關聯(lián)分析能夠尋找裝備故障之間的關聯(lián)關系,發(fā)現(xiàn)關鍵部位之間的故障伴生規(guī)律。
國內外專家學者在這方面開展了相關研究,如基于 N 1 校驗的故障相關性網絡、基于事故鏈信息的故障關聯(lián)矩陣、電機故障關聯(lián)分析等[15]。對于復雜裝備,常用的故障檢測方法往往只能得到相對獨立的故障信息,無法獲悉其中隱含的關聯(lián)關系,運用數(shù)據(jù)挖掘技術對大量故障數(shù)據(jù)開展相關性分析是解決這一問題的有效途徑。文獻[16]提出了一種航空設備故障關聯(lián)分析方法,將 Apriori 算法用于挖掘航空設備故障關聯(lián)關系并進行了驗證。
1.3 裝備質量數(shù)據(jù)處理
裝備質量數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)增強、數(shù)據(jù)離散化等內容。數(shù)據(jù)清洗起初是為了解決美國社會保險號碼的糾錯問題,現(xiàn)如今已經在許多領域得到了應用。隨著軍隊信息化建設的不斷推進,人們能夠在裝備全壽命周期內獲取越來越多的質量相關信息。在獲得這些數(shù)據(jù)之后,通過數(shù)據(jù)挖掘技術希望能從中抽取出有價值的知識。為了得到滿足裝備管理需求的有價值的信息,就要求所獲得的數(shù)據(jù)具有可靠性,同時能夠準確反映裝備實際情況。
但事實上,人們獲得的第一手數(shù)據(jù)往往含有噪聲,如果不預先進行清洗處理,其中不準確數(shù)據(jù)、異常數(shù)據(jù)以及人為造成的錯誤數(shù)據(jù)等可能影響數(shù)據(jù)挖掘效果甚至最終結論的準確性。沈小軍等提出的風電機組運行數(shù)據(jù)清洗方法根據(jù)拉依達準則,將服從正態(tài)分布的數(shù)據(jù)中超過3倍標準差的數(shù)據(jù)值視為異常值進行消除[17]。
文獻[18]提出運用決策樹分類模型來實現(xiàn)數(shù)據(jù)清洗,相對于傳統(tǒng)的數(shù)據(jù)清洗算法在性能上得到了提高。四分位法根據(jù)實測數(shù)據(jù)進行離群值分析處理,實現(xiàn)異常數(shù)據(jù)清洗,但此方法在異常數(shù)據(jù)比重較大時識別效果不佳[19]。處理大量異常數(shù)據(jù)時可采用支持向量回歸算法,其核心是用函數(shù)擬合數(shù)據(jù)[20]。K means算法能夠實現(xiàn)異常數(shù)據(jù)的快速識別,且具有較好的準確性[21]。
K 最近鄰算法及其改進方法對于數(shù)據(jù)缺失值的處理具有較好的效果[22]。實際采樣收集到的裝備運行狀態(tài)數(shù)據(jù)中,正常數(shù)據(jù)樣本量大,而故障數(shù)據(jù)樣本量小且對應的各種故障類型樣本分布不均衡。樣本數(shù)據(jù)的不平衡特性將嚴重影響基于數(shù)據(jù)驅動方法的有效性。
為實現(xiàn)數(shù)據(jù)驅動的武器系統(tǒng)電子元部件級故障診斷技術的工程應用,解決數(shù)據(jù)質量問題,楊華暉研究了電子元部件故障小樣本數(shù)據(jù)的增強方法,建立了基于生成式對抗網絡的故障小樣本數(shù)據(jù)增強模型,提出了基于多標簽一維 AC GAN 的數(shù)據(jù)增強方法,并以電壓整流器晶體管故障為例進行了驗證[23]。裝備質量相關數(shù)據(jù)中包括部分連續(xù)量,故數(shù)據(jù)離散化也是必不可少的數(shù)據(jù)準備環(huán)節(jié)之一。離散化是將連續(xù)的值域劃分為若干個區(qū)間,每個區(qū)間對應一個值,最后將連續(xù)數(shù)據(jù)轉化為離散量。
離散化數(shù)據(jù)對存儲空間的需求較小,形式更簡潔,能夠保證一些數(shù)據(jù)挖掘方法的順利運行,提高數(shù)據(jù)挖掘的效率。離散化算法主要有:PKID 算法,近似等頻離散化算法,基于聚類的離散化算法,ChiMerge 算法,基于粗糙集的離散化算法,CAIM 算法[24 25]。一些專家學者在開展自身科研工作的同時,對所涉及的數(shù)據(jù)處理方法也進行了研究改進。袁浩恒提出了一種并行比較并獲得最優(yōu)離散化的數(shù)據(jù)準備算法,針對不同數(shù)據(jù)集,先進行特性檢測以獲得其分布特性,按照分布特性進行數(shù)據(jù)集的異常值檢測和剔除,并行完成與分布特性適配的離散化方法處理[26]。
白堂博等人在文獻[27]中指出了傳統(tǒng)的均勻區(qū)段劃分法、加權劃分法和模糊指數(shù)法等離散化方法存在的問題,提出了基于符號聚合近似的關聯(lián)規(guī)則挖掘方法,對振動信號進行特征提取之后利用符號聚合近似方法進行數(shù)據(jù)離散化。從裝備質量信息分析處理的研究現(xiàn)狀來看,裝備質量信息因果分析與關聯(lián)分析所采用的方法可大致分為基于模型的方法和基于數(shù)據(jù)的方法這兩類;谀P偷姆椒ㄡ槍μ囟ㄐ吞柕难b備時分析結果較為精確,但其對系統(tǒng)先驗知識要求較高,難以滿足復雜裝備的需求。
基于數(shù)據(jù)的方法不依賴裝備先驗知識,方法適用性較強,不局限于特定對象,能更好適應新型裝備結構復雜、系統(tǒng)內部關聯(lián)緊密的特點,但其訓練周期較長,且對信號與數(shù)據(jù)要求更高。裝備質量數(shù)據(jù)處理的研究相對較少,仍有一些問題有待解決,數(shù)據(jù)清洗面臨異常數(shù)據(jù)處理不充分與隱藏有用信息過度剔除之間的矛盾;提高數(shù)據(jù)質量是數(shù)據(jù)驅動方法實現(xiàn)工程應用的基礎性研究,面對海量裝備質量數(shù)據(jù)時仍存在較大困難;數(shù)據(jù)離散化仍面臨離散化過度、離散化質量不高、有用信息丟失等問題。
2 數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中獲取有用信息的過程,其實質是綜合應用各種技術對數(shù)據(jù)進行處理和訓練,得到能夠反映輸出數(shù)據(jù)與輸入數(shù)據(jù)之間關系的模型。根據(jù)解決的問題和處理數(shù)據(jù)的方式,數(shù)據(jù)挖掘的方法可以分為回歸、分類、聚類、關聯(lián)規(guī)則、預測和離群點檢測這六大類;貧w是確定兩種以上參數(shù)之間定量關系的一種統(tǒng)計分析方法。
根據(jù)因變量的個數(shù)或者回歸函數(shù)的類型可將回歸方法分為一元線性回歸、一元非線性回歸、多元線性回歸、多元非線性回歸這幾類,此外,逐步回歸方法[28]和 Logistic 回歸方法[29]也是常用的回歸方法。回歸可用于裝備故障預測、剩余壽命預測、性能評估、數(shù)據(jù)清洗等研究,適合定量分析,回歸方法的選用比較靈活。分類是通過分析已知類別的訓練集得到分類規(guī)則,再用分類規(guī)則為新的數(shù)據(jù)劃分類別的方法。
目前分類方法的研究成果主要包括:決策樹方法、BP 神經網絡方法、貝葉斯分類、K 近鄰算法、判別分析、支持向量機等[30 32]。分類方法可用于故障診斷、壽命預測、裝備作戰(zhàn)效能評估、機內測試技術等研究,不同的分類方法各有優(yōu)劣,每一種方法都有特定的應用領域,但是通常只適合解決某一類問題。聚類是將原本沒有類別的對象聚集成由類似的對象集合組成的若干個類或者簇的過程。
目前聚類算法可以分為層次聚類、劃分聚類、基于模型的聚類、基于網格的聚類和基于密度的聚類這幾類,其中實踐應用較多的是 K means、神經網絡聚類、模糊 C 均值聚類、層次聚類、高斯聚類等方法[33 35]。聚類可用于故障診斷、裝備維修輔助決策、維修性分析、數(shù)據(jù)離散化等研究。關聯(lián)規(guī)則挖掘是發(fā)現(xiàn)數(shù)據(jù)項集之間關聯(lián)關系的過程,常見的算法有 Apriori 算法[36]和 FP Growth算法[37]。關聯(lián)規(guī)則被廣泛應用于裝備故障關聯(lián)分析、性能退化因素分析、可靠性工程等研究中,對于隱藏知識的發(fā)掘具有優(yōu)勢,但面對較大規(guī)模的數(shù)據(jù)集時,其效率不夠理想。
數(shù)據(jù)挖掘中的預測是依據(jù)現(xiàn)有的數(shù)據(jù)建立數(shù)學模型,從而對未來的數(shù)據(jù)進行預測。預測方法有灰色預測[38]、馬爾科夫預測[39]、回歸方法[40]、神經網絡[41]、最小二乘法[42]、平滑預測法[43]、自回歸模型[44]、自回歸移動平均模型[45]等。預測適用于裝備故障預測、剩余壽命預測等研究,優(yōu)點是能夠定量地描述事物的變化程度,依據(jù)歷史數(shù)據(jù)而不受主觀因素影響,缺點是靈活性不夠,不適合處理變化較大的數(shù)據(jù)。離群點是數(shù)據(jù)集中的少量異常數(shù)據(jù),可能是噪聲數(shù)據(jù),但也可能包含有用信息,離群點檢測的目的是發(fā)現(xiàn)這些隱藏的知識。
經典的檢測方法可以分為基于統(tǒng)計學的方法、基于距離或鄰近度的方法、基于密度的方法和基于聚類的方法。離群點檢測通常用于數(shù)據(jù)處理,提高數(shù)據(jù)分析的準確性。近些年離群點檢測的方法研究取得了一定進展。對于裝備質量信息分析處理涉及的不同內容,都有其適用的數(shù)據(jù)挖掘方法,質量信息因果分析適合采用回歸、分類、預測或離群點檢測方法,質量信息關聯(lián)分析主要運用關聯(lián)規(guī)則,裝備質量數(shù)據(jù)處理適用聚類、分類、回歸或離群點檢測方法。
3 面臨的問題及未來研究方向
我軍針對裝備質量信息分析已開展了一定的研究工作。在因果分析方面,故障診斷的相關研究較為廣泛和深入,不論是技術方法的探索還是體系框架的構建都取得了豐碩成果,提高復雜裝備故障診斷的準確度是需要重點解決的問題,智能診斷、綜合診斷等是近些年的研究熱點。故障預測的相關研究更傾向于技術與方法的改進,在航空裝備上得到了更為廣泛的應用。
剩余壽命預測通常將裝備中某個分系統(tǒng)或零部件如發(fā)動機、傳感器、電池、軸承等作為研究對象,對于具體問題的研究程度較深。在關聯(lián)分析方面,參數(shù)關聯(lián)分析和裝備性能退化因素分析的研究相對較少,主要開展算法優(yōu)化或者建立模型等工作,故障關聯(lián)分析受到的關注較多,其應用也更廣泛,研究人員依據(jù)不同的對象提出了許多有效的方法。
在數(shù)據(jù)處理方面,數(shù)據(jù)清洗、數(shù)據(jù)增強、數(shù)據(jù)離散化等通常是為滿足特定需求而實施的,專門的研究較少,仍有較大發(fā)展空間。隨著我軍現(xiàn)代化建設的不斷推進,新一代武器系統(tǒng)得到了更為廣泛的運用,新型裝備全壽命周期內的質量影響因素復雜多變,使得其質量退化特性和故障規(guī)律難以把握。傳統(tǒng)的定期維修、視情維修等方法在故障診斷的準確性、故障檢測與排除的及時性、保障效率以及維護成本等方面存在一定的弊端,難以適應新形勢下裝備保障需求的發(fā)展。
依托“裝備云”等平臺,利用數(shù)據(jù)挖掘技術進行裝備質量信息的分析處理為解決這些現(xiàn)實矛盾,提高裝備質量問題分析能力、裝備質量評估能力和裝備預防性維修能力開辟了新的途徑,為提升裝備管理保障的科學化水平提供了有力支持[46 48]。對于數(shù)據(jù)分析,目前我軍采用的方法包括深度神經網絡、偏相關分析、關聯(lián)規(guī)則分析、大數(shù)據(jù)分析等[49 51]。
3.1 面臨的問題
目前,一些專家學者已經將數(shù)據(jù)挖掘技術運用于裝備質量管理知識發(fā)現(xiàn)、裝備使用質量信息分析、裝備故障智能診斷方法、裝備設計質量綜合評估方法、裝備故障診斷系統(tǒng)等領域的研究,并提出了裝備質量信息分析處理的構想,初步建立了基于數(shù)據(jù)挖掘的裝備使用質量信息管理系統(tǒng)框架,探索了裝備故障診斷的方法,對數(shù)據(jù)挖掘算法開展了深入研究。但是,利用數(shù)據(jù)挖掘技術實現(xiàn)裝備質量信息分析處理還面臨一些問題:
1)數(shù)據(jù)挖掘是涉及機器學習、人工智能、數(shù)據(jù)庫理論以及統(tǒng)計學等學科的交叉研究領域,將數(shù)據(jù)挖掘技術用于裝備質量信息分析處理的研究具有一定的難度,而且部隊相關條件建設還不夠完善,如“裝備云”等平臺仍處于規(guī)劃和發(fā)展階段,因此,目前研究將數(shù)據(jù)挖掘技術運用于裝備質量信息分析處理的學者較少,F(xiàn)有的研究主要是提出系統(tǒng)框架設計方案或者提供研究思路,在問題的解決方法和具體實踐工作方面比較欠缺。
2)許多專家學者對數(shù)據(jù)挖掘技術進行了深入的研究,取得了豐碩的成果。經典的數(shù)據(jù)挖掘方法思路簡單且技術成熟,但是挖掘效率不高,如果參與挖掘的裝備質量相關數(shù)據(jù)涉及的項目較多,效果可能不理想,將影響復雜裝備質量問題分析能力。改進算法種類繁多,不同算法的設計理念與實現(xiàn)思路各異,在特定的應用背景下具有良好的運行效果,但相關研究不夠成熟,對于解決其他問題是否同樣適用需要論證。
3)數(shù)據(jù)處理是解決原始數(shù)據(jù)存在問題,保證數(shù)據(jù)挖掘順利進行的重要步驟。目前有些與數(shù)據(jù)挖掘相關的文獻對數(shù)據(jù)準備階段工作的論述和數(shù)據(jù)處理方法的研究比較欠缺。一些學者用于挖掘的數(shù)據(jù)不是原始數(shù)據(jù),但未將數(shù)據(jù)準備納入到研究范圍內,而是用人工方法轉換了部分數(shù)據(jù),在數(shù)據(jù)量較大或者數(shù)據(jù)質量不高時效率較低。對于數(shù)據(jù)清洗的理論研究還不夠成熟,不同的數(shù)據(jù)離散化方法對于裝備數(shù)據(jù)挖掘的適應性有待驗證。
3.2 未來研究方向
目前,基于數(shù)據(jù)挖掘的裝備質量信息分析處理技術研究仍有許多工作亟待完成,未來研究方向主要體現(xiàn)在以下幾個方面:
1)裝備質量相關數(shù)據(jù)是質量信息分析處理的基礎。裝備全壽命周期內積累的大量信息通常以多種形式存在,例如以結構化數(shù)據(jù)形式存在的數(shù)據(jù)表格、以半結構化數(shù)據(jù)形式存在的自描述性文本、以非機構化數(shù)據(jù)形式存在的描述性文字等。對于特定類型的裝備,針對其質量監(jiān)控和壽命評估、作戰(zhàn)使用及延壽整修決策需要,甄別篩選與裝備質量相關的數(shù)據(jù),歸納提煉形成質量信息集,構建全壽命質量信息數(shù)據(jù)體系。2)根據(jù)裝備質量數(shù)據(jù)挖掘工作需要,研究針對不同問題的數(shù)據(jù)清洗方法和具有普遍適用性與高效率的數(shù)據(jù)離散化算法,提高裝備質量數(shù)據(jù)處理效果。
3)運用云技術,研究特定型號裝備全壽命質量數(shù)據(jù)資源建設。結合在貯存、使用、勤務、維修等環(huán)節(jié)質量數(shù)據(jù)的生成特點,研究終端節(jié)點裝備質量數(shù)據(jù)的采集、存儲和管理機制,利用云存儲的分布式優(yōu)勢,實現(xiàn)數(shù)據(jù)的終端采集,云端處理。
4)結合裝備質量數(shù)據(jù)的特點,立足部隊裝備管理實際需求,利用關聯(lián)規(guī)則挖掘方法,發(fā)掘出質量參數(shù)之間的關聯(lián)關系,運用分類、預測等數(shù)據(jù)挖掘方法,分析裝備質量退化原因及故障發(fā)生規(guī)律。研究裝備質量信息挖掘方法,評估算法的適應性并設法改進。優(yōu)化方法方面可以在與其他算法、技術進行融合或各種改進方式綜合使用上取得突破。5)依托數(shù)據(jù)挖掘技術和云技術,打破傳統(tǒng)的層級式保障模式,探索裝備全壽命質量信息資源應用機制與方法。根據(jù)不同應用場景和功能需求,構建云終端應用,設置終端軟件,實現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)查詢、數(shù)據(jù)處理、數(shù)據(jù)分析、質量評估、維修預測等功能。
4 結束語
數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘出有用信息的過程,通過挖掘數(shù)據(jù)中隱含的信息,可以得到平時難以獲取的知識和事物背后隱藏的規(guī)律;跀(shù)據(jù)挖掘的裝備質量信息分析處理的實質是運用數(shù)據(jù)挖掘技術從大量裝備質量相關數(shù)據(jù)中采掘出其中的關聯(lián)關系和因果關系,從而探尋裝備質量退化特性和故障規(guī)律,充分發(fā)揮質量數(shù)據(jù)的效用,進而破除傳統(tǒng)裝備保障方法存在的弊端。
基于數(shù)據(jù)挖掘的裝備質量信息分析處理技術為提高裝備質量問題分析能力、裝備質量評估能力和裝備預防性維修能力拓展了思路,能夠為提升裝備管理保障的科學化水平提供有力支持。如何解決現(xiàn)有研究中面臨的問題,使基于數(shù)據(jù)挖掘的裝備質量信息分析處理技術在實際工程應用中發(fā)揮更大作用,將是未來的重要研究方向。
參考文獻
[1] 余磊. 基于本體的裝備 PHM 信息共享技術研究[D].石家莊:陸軍工程大學,2017.
[2] 黃睿,劉小方,鄭祥. 某型導彈性能質量評估系統(tǒng)設計與實現(xiàn)[J]. 火炮發(fā)射與控制學報,2019,40(2):88 92
.[3] 蔡金燕,韓春輝,孟亞峰. Analog circuit testability forfault diagnosis[J]. Tsinghua Science andTechnology,2007,12(S1):270 274.
[4] HU LQ,HE CF,CAI ZQ,et al. Track circuit faultprediction method based on grey theory and expertsystem[J]. Journal of Visual Communication and ImageRepresentation,2019,58:37 45
.[5] 王亮,呂衛(wèi)民,滕克難,等. 基于數(shù)據(jù)驅動的裝備故障預測技術研究 [J]. 計算機測量與控制,2013,21(8):2087 2089+2105.
[6] RAHIMI A,KUMAR K D,Alighanbari H. Failureprognosis for satellite reaction wheels using Kalman filterand particle filter[J]. Journal of Guidance,Control,andDynamics,2020,43(3):585 588.
作者:李馥林,孟晨,范書義
轉載請注明來自發(fā)表學術論文網:http:///dzlw/29919.html