本文摘要:摘 要:近年來,隨著網(wǎng)絡(luò)的發(fā)展和新興技術(shù)的出現(xiàn),尤其是物聯(lián)網(wǎng)技術(shù)的推廣,大數(shù)據(jù)成為眼下最流行的技術(shù),這必然會(huì)給目前的數(shù)據(jù)庫和信息處理技術(shù)帶來新的挑戰(zhàn),舊的數(shù)據(jù)處理、數(shù)據(jù)挖掘技術(shù)已經(jīng)很難滿足要求,必然要求數(shù)據(jù)處理技術(shù)進(jìn)行新的革命性的變革。近年
摘 要:近年來,隨著網(wǎng)絡(luò)的發(fā)展和新興技術(shù)的出現(xiàn),尤其是物聯(lián)網(wǎng)技術(shù)的推廣,大數(shù)據(jù)成為眼下最流行的技術(shù),這必然會(huì)給目前的數(shù)據(jù)庫和信息處理技術(shù)帶來新的挑戰(zhàn),舊的數(shù)據(jù)處理、數(shù)據(jù)挖掘技術(shù)已經(jīng)很難滿足要求,必然要求數(shù)據(jù)處理技術(shù)進(jìn)行新的革命性的變革。近年來,云計(jì)算技術(shù)也在不斷的發(fā)展,二者的結(jié)合會(huì)給信息處理帶來很多新的挑戰(zhàn)和機(jī)遇。
關(guān)鍵詞:云計(jì)算;大數(shù)據(jù);數(shù)據(jù)挖掘;數(shù)據(jù)處理;存儲(chǔ) 電子核心期刊
1 大數(shù)據(jù)概述
什么是大數(shù)據(jù)?“大數(shù)據(jù)”是一個(gè)數(shù)據(jù)量特別大、類別特別多的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫工具對(duì)其內(nèi)容進(jìn)行加工處理。“大數(shù)據(jù)”首先是指數(shù)據(jù)量非常龐大,指代大型數(shù)據(jù)集,一般在10TB規(guī)模左右,在日常的應(yīng)用中,多數(shù)的單位都是把多個(gè)來源于不同系統(tǒng)的數(shù)據(jù)集統(tǒng)一的放在一起,形成了更為龐大的數(shù)據(jù)量;其次是指數(shù)據(jù)類型特別多,現(xiàn)在興起的云計(jì)算技術(shù),使得現(xiàn)在創(chuàng)造數(shù)據(jù)的主體由企業(yè)逐步的轉(zhuǎn)向個(gè)體,而我們個(gè)體創(chuàng)造的數(shù)據(jù)大多是文檔、圖片、音頻、視頻等,這些數(shù)據(jù)都是非結(jié)構(gòu)化的,還有大多數(shù)的企業(yè)的辦公自動(dòng)化通過網(wǎng)絡(luò)得以實(shí)現(xiàn),由此產(chǎn)生的數(shù)據(jù)也大多是非結(jié)構(gòu)化的。也就是說我們要處理的數(shù)據(jù)來源于不同的系統(tǒng)和數(shù)據(jù)源,數(shù)據(jù)類型和數(shù)據(jù)格式更為復(fù)雜,已不在局限于結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu),而是半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的一個(gè)混合體。第三是要求要有非常高的相應(yīng)處理速度,盡管要處理的數(shù)據(jù)量異常龐大,也必須對(duì)如此龐大的數(shù)據(jù)量做到實(shí)時(shí)處理。最后一個(gè)特點(diǎn)是指數(shù)據(jù)真實(shí)性高,隨著社交數(shù)據(jù)、企業(yè)交易和應(yīng)用數(shù)據(jù)等新數(shù)據(jù)源的崛起,傳統(tǒng)數(shù)據(jù)源的局限被打破,企業(yè)越來越需要高效的信息處理,以確保數(shù)據(jù)的真實(shí)性、準(zhǔn)確性及安全性。
另外,結(jié)構(gòu)組成更為復(fù)雜的新數(shù)據(jù)開始出現(xiàn),而且生成的速度提高到了一個(gè)前所未有的程度。例如:社交網(wǎng)絡(luò)數(shù)據(jù)、備份數(shù)據(jù)和物聯(lián)網(wǎng)應(yīng)用下的傳感器數(shù)據(jù)都屬于人們?cè)诜治鲋嘘P(guān)注的新數(shù)據(jù)源,企業(yè)需要對(duì)這些數(shù)據(jù)類型進(jìn)行快速、準(zhǔn)確、可靠的分析,以便充實(shí)其已知的信息數(shù)據(jù)量。
在企業(yè)內(nèi)部,隨著客戶以在線渠道作為開展商業(yè)交易及與企業(yè)互動(dòng)的主要手段和網(wǎng)絡(luò)日志的不斷增加,為監(jiān)測(cè)和優(yōu)化業(yè)務(wù)運(yùn)營(yíng)而部署的傳感器網(wǎng)絡(luò)和機(jī)器數(shù)量也越來越多。結(jié)果就生成了大量新數(shù)據(jù)源、快速增加的數(shù)據(jù)量和迅速增加的新數(shù)據(jù)流,需要分析所有這些新數(shù)據(jù)。“大數(shù)據(jù)”在互聯(lián)網(wǎng)與傳統(tǒng)企業(yè)之間建立了緊密的聯(lián)系,推動(dòng)了互聯(lián)網(wǎng)企業(yè)與傳統(tǒng)的企業(yè)的融合,逐步掀起了一場(chǎng)消費(fèi)模式、生產(chǎn)模式、管理模式的革命。
2 云計(jì)算概述
2.1 云計(jì)算的概念
“云計(jì)算”將計(jì)算機(jī)從客戶端集中到“云端”,作為功能應(yīng)用通過互聯(lián)網(wǎng)絡(luò)提供給客戶端,它將用戶提交的各種需求動(dòng)態(tài)、合理的分配給分布在各處的計(jì)算機(jī)系統(tǒng),從而提出需求的各種應(yīng)用系統(tǒng)能夠獲取相應(yīng)的計(jì)算服務(wù)、存儲(chǔ)空間。用戶關(guān)心的是需求提出的功能,而不需要去關(guān)心應(yīng)用功能是怎么實(shí)現(xiàn)的,所有的應(yīng)用功能都是由服務(wù)提供商來完成的。它是一種商業(yè)計(jì)算模型,而不是一種平臺(tái)或者架構(gòu)。
實(shí)現(xiàn)云計(jì)算所需要的基礎(chǔ)設(shè)施有多種技術(shù)結(jié)合來完成。尤其是需要一套系統(tǒng)的軟件對(duì)分布在各處的硬件進(jìn)行虛擬化調(diào)度和管理,即把分布于各處的計(jì)算機(jī)軟、硬件資源集中起來進(jìn)行綜合處理。
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/2928.html