本文摘要:摘要:在互聯(lián)網(wǎng)時代下,人們的生活、生產(chǎn)方式都出現(xiàn)了很大改變。雖然,計算機網(wǎng)絡能夠為人們提供大量的信息使用,但其也有著很多安全問題的存在。最為突出的就是網(wǎng)絡病毒威脅,一旦受到網(wǎng)絡病毒攻擊,就可能導致人們的重要信息被泄露,出現(xiàn)經(jīng)濟上不可逆的損
摘要:在互聯(lián)網(wǎng)時代下,人們的生活、生產(chǎn)方式都出現(xiàn)了很大改變。雖然,計算機網(wǎng)絡能夠為人們提供大量的信息使用,但其也有著很多安全問題的存在。最為突出的就是網(wǎng)絡病毒威脅,一旦受到網(wǎng)絡病毒攻擊,就可能導致人們的重要信息被泄露,出現(xiàn)經(jīng)濟上不可逆的損失。因此,本文重點論述了計算機網(wǎng)絡病毒防范中數(shù)據(jù)挖掘技術的相關運用,僅供參考。
關鍵詞:計算機網(wǎng)絡;病毒防范;數(shù)據(jù)挖掘技術
計算機網(wǎng)絡論文投稿刊物:《上海信息化》(月刊)創(chuàng)刊于2000年,由《上海信息化》雜志社主辦。是國內(nèi)第一本全面反映政府、企業(yè)信息化建設的綜合類公開出版刊物。雜志定位為政府信息化的窗口,企業(yè)信息化的舞臺,IT從業(yè)人員的講壇。創(chuàng)刊以來,雜志立足長三角,面向全國,以創(chuàng)新開放的理念、豐富貼切的內(nèi)容、廣泛深入的觸角,以及鮮活生動的人物報道,在業(yè)界產(chǎn)生了較大影響。獲“世博報道優(yōu)秀期刊”。
網(wǎng)絡病毒是一種計算機網(wǎng)絡中的可執(zhí)行代碼,這類代碼一方面通常是由人進行編寫而成的,有著編寫者的主觀意識表達;另外一方面,則是系統(tǒng)代碼。網(wǎng)絡病毒通過對主機的感染之后,再借助互聯(lián)網(wǎng)進行全面?zhèn)鞑,從而對其他計算機甚至是整個網(wǎng)絡進行惡意攻擊。計算機網(wǎng)絡受到病毒入侵之后,其中的信息可能會被盜取,進而造成不可預計的經(jīng)濟損失。
但由于計算機網(wǎng)絡所具有的開放性,在受到病毒攻擊后,控制難度大,倘若防范不夠及時,那么網(wǎng)絡病毒往往會形成大范圍傳播的趨勢,并導致網(wǎng)絡系統(tǒng)全面失控以及癱瘓,并給企業(yè)、個人,甚至是國家形成巨大影響。正因如此,計算機網(wǎng)絡系統(tǒng)的安全,已經(jīng)被上升到國家發(fā)展的高度。唯有在一個安全的網(wǎng)絡環(huán)境下,廣大用戶才可以對網(wǎng)絡進行更好的應用與體驗。因此,研究計算機網(wǎng)絡病毒防范技術具有一定的現(xiàn)實意義。
1網(wǎng)絡病毒的特點分析
結合當前現(xiàn)有的相關文獻資料,網(wǎng)絡病毒主要有如下特點:(1)針對性最早時候的網(wǎng)絡病毒較為固化,其目的只是為了干擾程序員編寫程序,但當前的網(wǎng)絡病毒目的愈加多元,且功能性也更強[1]。同時,隨著病毒開發(fā)技術的日益提升,關于網(wǎng)絡病毒的設計和開發(fā)的目的性也愈加明確,入侵和攻擊呈現(xiàn)出更多攻擊性。(2)多樣性即便網(wǎng)絡病毒開發(fā)和構成都不復雜,但其僅用幾個程序指令,就能夠衍生出其他的一些病毒。同時,當前很多程序員都有著較高水平,很容易就編寫出一些病毒程序。此外,病毒繁殖速度快,且有著很多種類,這些都使其危害性增加。(3)多元化網(wǎng)絡病毒傳播方式十分多元化,尤其是網(wǎng)絡病毒技術的不斷提高,這種多元化更為明顯。比如,我們?nèi)粘K龅降南到y(tǒng)漏洞,病毒程序通過識別存在漏洞的主機,就能夠同時入侵并控制住對方。同時,病毒能夠針對性的掃描文件夾,并持續(xù)復制更多的病毒對網(wǎng)絡系統(tǒng)展開入侵。
2相關概念以及基本構成內(nèi)容概述
2.1關于數(shù)據(jù)挖掘技術的概念解析
數(shù)據(jù)挖掘技術具體是采用算法搜索隱藏在大量數(shù)據(jù)中的未知的,并且具有價值的知識與信息的過程。它涉及許多知識,主要有模糊識別、機器學習、情報檢索、統(tǒng)計學、計算機技術等。在進行挖掘的時候,則分為了數(shù)據(jù)準備、找尋數(shù)據(jù)規(guī)律、表示數(shù)據(jù)規(guī)律這三個步驟。在確定數(shù)據(jù)挖掘后,就會啟動相關引擎,對需要挖掘的數(shù)據(jù)進行搜索,將其中數(shù)據(jù)的規(guī)律找出[2]。完整的數(shù)據(jù)挖掘包含了許多工作,數(shù)據(jù)的預處理是重點所在,其中主要包含了數(shù)據(jù)的凈化、鏈接數(shù)據(jù)表、變量整合、格式轉(zhuǎn)換等。唯有將數(shù)據(jù)的預處理工作做好,才可為后續(xù)分析數(shù)據(jù)奠定良好基礎。
2.2基本構成內(nèi)容概述
數(shù)據(jù)挖掘技術具體由這些內(nèi)容構成,具體如下:(1)數(shù)據(jù)源模塊以抓包為基礎的數(shù)據(jù)源模塊,主要是依托網(wǎng)絡來獲取相關數(shù)據(jù)包。通常來講,在數(shù)據(jù)源模塊之中有著初始的網(wǎng)絡數(shù)據(jù)包,即:數(shù)據(jù)庫信息結構。在抓包程序的支持下,能夠不斷虎丘對應的數(shù)據(jù)包,以此為基礎,再將數(shù)據(jù)朝著對應的處理模塊進行有效傳輸。(2)預處理模塊在數(shù)據(jù)源模塊的支持下,可將數(shù)據(jù)成功傳輸?shù)筋A處理模塊之中,然后可以對模塊進行預處理。這個過程也可以被理解成為對數(shù)據(jù)進行初始挖掘,具體是通過分析與變換,預處理模塊能夠?qū)⒅暗臄?shù)據(jù)轉(zhuǎn)為有著識別性特點的可處理數(shù)據(jù),進而促進后續(xù)數(shù)據(jù)處理的有序進行。再將數(shù)據(jù)進行預處理之后,有利于全面提升有關數(shù)據(jù)的分析效率與質(zhì)量,從而對數(shù)據(jù)進行更好的處理。
(3)規(guī)則庫模塊該模塊的具體作用是將對應的規(guī)則集進行存儲。在計算機受到網(wǎng)絡病毒攻擊的時候,通過數(shù)據(jù)挖掘、聚類分析、特征的識別,就可以實現(xiàn)這些規(guī)則集的獲取。在數(shù)據(jù)挖掘的時候,通過對規(guī)則集所記錄的計算機網(wǎng)絡病毒信息的記錄,就可以有效分析網(wǎng)絡之中所潛在的病毒,進而實現(xiàn)病毒的有效防范[3]。同時,規(guī)則庫模塊還可針對計算機網(wǎng)絡病毒進行鑒別。在未標記的數(shù)據(jù)集中運用聚類分析,將數(shù)據(jù)集分為多組數(shù)據(jù),通過各數(shù)據(jù)間存在的差異度,鑒定計算機網(wǎng)絡病毒。
(4)數(shù)據(jù)挖掘模塊。數(shù)據(jù)挖掘模塊,是將相關數(shù)據(jù)通過運用數(shù)據(jù)挖掘的計算方法進行整合,使之成為事件庫,然后再分析這一事件庫中的數(shù)據(jù)信息,并向決策模塊傳輸最終的分析數(shù)據(jù),做進一步處理。(5)決策模塊。將規(guī)則庫中的相關規(guī)則和數(shù)據(jù)挖掘的最終結果進行匹配,是決策模塊的主要作用。倘若經(jīng)過數(shù)據(jù)挖掘之后所得出的結果與規(guī)則模塊相互匹配,那么就意味著蠕蟲病毒已經(jīng)入侵到數(shù)據(jù)包之中。倘若結果與規(guī)則模塊未匹配,那么預防模塊通常會有對應的提示,意味著數(shù)據(jù)包之中可能存在的蠕蟲病毒是未知病毒,并在規(guī)則庫中記錄下這一網(wǎng)絡病毒。
3數(shù)據(jù)挖掘技術在計算機網(wǎng)絡病毒防范中的具體運用
(1)分類規(guī)則之所以分類,就是為了把數(shù)據(jù)分門別類,然后利用統(tǒng)計學、機器學習等方法,分類建立模型。(2)關聯(lián)分析關聯(lián)分析,主要目的是為了將數(shù)據(jù)庫中存在的關聯(lián)網(wǎng)找出來,在兩個及以上的變量值中,若有一定的規(guī)律性存在,則表明這些數(shù)據(jù)之間有可能一定的關聯(lián)關系存在。借助關聯(lián)網(wǎng),就可以將整個數(shù)據(jù)庫中的關系挖掘出來,進而更好將病毒抓到。(3)聚類規(guī)則所謂聚類的規(guī)則,就是先分解與分組不同的數(shù)據(jù)包,進行分組的時候需要將特征相似的數(shù)據(jù)分在一起。借助聚類,可以實現(xiàn)數(shù)據(jù)不同特征的識別,從而將不同數(shù)據(jù)的屬性關系、分布模式更好呈現(xiàn)出來。
轉(zhuǎn)載請注明來自發(fā)表學術論文網(wǎng):http:///dzlw/22515.html