本文摘要:摘要:在信息時(shí)代背景下大數(shù)據(jù)技術(shù)得到快速發(fā)展,在諸多領(lǐng)域發(fā)揮出越來(lái)越重要的作用。大數(shù)據(jù)時(shí)代的到來(lái)對(duì)科技情報(bào)研究提供了更多新思路與新方向。為此,就大數(shù)據(jù)的概念以及在科技情報(bào)研究領(lǐng)域的應(yīng)用技術(shù)進(jìn)行論述,并探討了大數(shù)據(jù)時(shí)代背景下科技情報(bào)研究工作的
摘要:在信息時(shí)代背景下大數(shù)據(jù)技術(shù)得到快速發(fā)展,在諸多領(lǐng)域發(fā)揮出越來(lái)越重要的作用。大數(shù)據(jù)時(shí)代的到來(lái)對(duì)科技情報(bào)研究提供了更多新思路與新方向。為此,就大數(shù)據(jù)的概念以及在科技情報(bào)研究領(lǐng)域的應(yīng)用技術(shù)進(jìn)行論述,并探討了大數(shù)據(jù)時(shí)代背景下科技情報(bào)研究工作的對(duì)策。
關(guān)鍵詞:大數(shù)據(jù);科技情報(bào)研究;對(duì)策
0引言
隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展以及海量數(shù)據(jù)處理能力的增強(qiáng),進(jìn)入了大數(shù)據(jù)時(shí)代。在大數(shù)據(jù)時(shí)代促使產(chǎn)業(yè)提升、科技發(fā)展的一個(gè)有效手段就是探索基于大數(shù)據(jù)處理技術(shù)的動(dòng)態(tài)情報(bào)解決策略。伴隨移動(dòng)終端與智能手機(jī)的大范圍普及,公眾自身的信息數(shù)據(jù)都可能成為被記錄與分析的數(shù)據(jù)。這給科技情報(bào)研究工作帶來(lái)了新機(jī)遇與新挑戰(zhàn)。
1大數(shù)據(jù)的定義與特點(diǎn)
關(guān)于大數(shù)據(jù)的定義尚未形成統(tǒng)一的標(biāo)準(zhǔn),主流觀點(diǎn)認(rèn)為這是一種數(shù)據(jù)量非常大、數(shù)據(jù)形式多元化的非結(jié)構(gòu)化數(shù)據(jù)。維基百科中將大數(shù)據(jù)定義為所包含的數(shù)據(jù)量規(guī)模龐大到難以通過(guò)當(dāng)前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營(yíng)決策目的的資訊[1]。
情報(bào)論文投稿刊物:《廣東科技》(半月刊)創(chuàng)于1992年,是由廣東省科技廳主管、廣東省科技情報(bào)研究所主辦的綜合性科技刊物,國(guó)內(nèi)外公開(kāi)發(fā)行的廣東省唯一綜合性省級(jí)科技刊物,是反映廣東省科技與經(jīng)濟(jì)發(fā)展的窗口。本刊堅(jiān)持以促進(jìn)科技成果轉(zhuǎn)化、科技創(chuàng)新為目標(biāo),融新聞、科技、經(jīng)濟(jì)、信息、產(chǎn)業(yè)、市場(chǎng)、服務(wù)為一體,內(nèi)容豐富、時(shí)代感強(qiáng),是推動(dòng)科技進(jìn)步、加強(qiáng)技術(shù)創(chuàng)新、發(fā)展高科技、實(shí)現(xiàn)產(chǎn)業(yè)化的重要宣傳陣地。
它的特征可歸納為“4V”:①Volume。數(shù)據(jù)容量巨大,搜集與分析的數(shù)據(jù)量巨大,一般數(shù)據(jù)量規(guī)?沙^(guò)10TB。②Variety。數(shù)據(jù)種類多,來(lái)源廣,格式多元化。③Velocity。數(shù)據(jù)流動(dòng)速度快,大數(shù)據(jù)通常是以數(shù)據(jù)流的形式出現(xiàn),數(shù)據(jù)流動(dòng)速度極快,傳統(tǒng)系統(tǒng)難以處理。④Value。價(jià)值密度低,盡管數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),但隱藏在其中的有用信息并未實(shí)現(xiàn)對(duì)應(yīng)比例增長(zhǎng),反而增加了獲取有用信息的難度[2]。可見(jiàn),盡管大數(shù)據(jù)擁有很好的潛在價(jià)值,但若受限于傳統(tǒng)思維與技術(shù),則容易被淹沒(méi)在數(shù)據(jù)海洋中,難以獲取有用信息。
2科技情報(bào)研究工作中應(yīng)用的大數(shù)據(jù)技術(shù)
2.1數(shù)據(jù)挖掘研究技術(shù)
從廣義上來(lái)講,數(shù)據(jù)挖掘是指知識(shí)的發(fā)現(xiàn)過(guò)程是從大量的、有噪聲的、不完全的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提取出人們事先不知、隱含在其中但有用的信息與知識(shí)的過(guò)程。該技術(shù)涉及到的學(xué)科領(lǐng)域很多,除了統(tǒng)計(jì)學(xué)、算法外,還包括數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、模式識(shí)別、高性能計(jì)算等技術(shù)[3]。
根據(jù)數(shù)據(jù)挖掘的定義可以發(fā)現(xiàn)它與情報(bào)研究有著密切的關(guān)聯(lián)。利用數(shù)據(jù)挖掘技術(shù)能夠有效解決情報(bào)研究問(wèn)題。運(yùn)用該技術(shù)對(duì)目標(biāo)關(guān)聯(lián)規(guī)劃進(jìn)行研究,進(jìn)而發(fā)現(xiàn)科技情報(bào)中存在的轉(zhuǎn)換關(guān)系。根據(jù)科技情報(bào)研究工作的需要,運(yùn)用大數(shù)據(jù)技術(shù)開(kāi)發(fā)相關(guān)數(shù)據(jù)挖掘工具,借助智能化輔助分析功能,提高科技研究人員的工作效率,縮短研究時(shí)間。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于科技情報(bào)研究工作中,首先對(duì)研究任務(wù)做好種類劃分,運(yùn)用數(shù)據(jù)挖掘技術(shù)的類別功能,歸納整理這些研究任務(wù)的共同點(diǎn)與差異性,構(gòu)建數(shù)據(jù)挖掘技術(shù)適用于科技情報(bào)研究工作的適用標(biāo)準(zhǔn)。然后,數(shù)據(jù)挖掘技術(shù)的組合形式及相關(guān)算法應(yīng)圍繞研究任務(wù)的實(shí)際情況作出恰當(dāng)?shù)男拚瑢?duì)挖掘數(shù)據(jù)進(jìn)行合理評(píng)價(jià)等等,這些都是科技情報(bào)研究工作對(duì)數(shù)據(jù)挖掘技術(shù)提出的要求。
2.2智能化研究技術(shù)
智能化技術(shù)涉及領(lǐng)域廣泛,涵蓋了神經(jīng)網(wǎng)絡(luò)、網(wǎng)絡(luò)分析、機(jī)器學(xué)習(xí)、模式識(shí)別、遺傳算法、預(yù)測(cè)建模等諸多學(xué)科知識(shí)。運(yùn)用智能化技術(shù)開(kāi)展科技情報(bào)研究工作,可實(shí)現(xiàn)對(duì)高級(jí)、復(fù)雜信息的智能化分析處理[4]。這能夠減輕工作人員的工作強(qiáng)度,使其有更多精力去研究方法的優(yōu)化以及研究結(jié)果的應(yīng)用。在信息技術(shù)高速發(fā)展的背景下,科技情報(bào)研究對(duì)象不再局限于傳統(tǒng)的報(bào)刊雜志書(shū)籍,還應(yīng)注重網(wǎng)絡(luò)信息,比如網(wǎng)絡(luò)上的圖片、音頻、視頻等信息。運(yùn)用相關(guān)技術(shù)手段對(duì)上述網(wǎng)絡(luò)信息數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,為智能化技術(shù)的應(yīng)用做好準(zhǔn)備。面對(duì)多元化的數(shù)據(jù)時(shí),智能化技術(shù)應(yīng)根據(jù)對(duì)象來(lái)分析,從語(yǔ)義層面上給予技術(shù)支持。
此外,傳統(tǒng)的統(tǒng)計(jì)分析難以適應(yīng)信息海量增長(zhǎng)的時(shí)代需要,而應(yīng)借助機(jī)器學(xué)習(xí)、模式識(shí)別等技術(shù)來(lái)開(kāi)展科技情報(bào)研究工作。運(yùn)用智能化技術(shù)能夠避免很多人為因素的干擾,提高研究結(jié)果的準(zhǔn)確性與真實(shí)性。
2.3可視化技術(shù)
科技情報(bào)研究對(duì)象具有信息分散、數(shù)據(jù)結(jié)構(gòu)多樣的特點(diǎn),過(guò)去主要以人工分析為主,容易受到各種非結(jié)構(gòu)性與不確定性因素的干擾,因此,很難形成規(guī)則的分析模式與分析流程,從而增大了數(shù)據(jù)挖掘規(guī)則的難度。基于此,可通過(guò)可視化數(shù)據(jù)分析技術(shù)來(lái)解決,構(gòu)建完整的可視化圖表進(jìn)行分析。通過(guò)圖表可以了解全部數(shù)據(jù)信息,而且也能看到數(shù)據(jù)分析的過(guò)程以及數(shù)據(jù)鏈的走向,便于研究人員對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)性分析,再輔以人工操作?梢暬脚_(tái)具有多種視圖,用于顯示數(shù)據(jù)信息,利用網(wǎng)絡(luò)分析、空間分析、信息分析等研究手段來(lái)協(xié)調(diào)人機(jī)間的交互溝通,便于工作人員對(duì)分析結(jié)果的理解與運(yùn)用。
3大數(shù)據(jù)時(shí)代做好科技情報(bào)研究工作的對(duì)策
3.1強(qiáng)化大數(shù)據(jù)觀念科技情報(bào)研究人員首先要樹(shù)立起大數(shù)據(jù)意識(shí),充分認(rèn)識(shí)到大數(shù)據(jù)對(duì)科技情報(bào)研究工作帶來(lái)的機(jī)遇與挑戰(zhàn),掌握大數(shù)據(jù)技術(shù),善于運(yùn)用這些技術(shù)來(lái)挖掘分析科技情報(bào)信息。為此,科技情報(bào)研究所應(yīng)加強(qiáng)對(duì)工作人員的教育培訓(xùn),組織他們學(xué)習(xí)大數(shù)據(jù)技術(shù),了解各種大數(shù)據(jù)分析技術(shù)方法,提高大數(shù)據(jù)應(yīng)用水平,更好地推動(dòng)科技情報(bào)研究工作的開(kāi)展。
3.2科學(xué)利用各種數(shù)據(jù)源
情報(bào)研究的結(jié)果會(huì)對(duì)社會(huì)產(chǎn)生深遠(yuǎn)的影響,因此,必須確保情報(bào)分析結(jié)果準(zhǔn)確可靠。這需要從源頭抓起,在分析數(shù)據(jù)的過(guò)程中加以完善與豐富。情報(bào)研究工作比較復(fù)雜,各種信息源的特性也明顯不同,因此,綜合運(yùn)用多種信息源已成為科技情報(bào)研究的重要趨勢(shì)[5]。
研究人員需從問(wèn)題出發(fā),將全部信息資源進(jìn)行系統(tǒng)化整合,用于情報(bào)研究。其中,信息源不僅包括學(xué)術(shù)論文、專利等文獻(xiàn)資源,也包括文本、數(shù)據(jù)、各種正式或非正式出版物。研究人員應(yīng)先熟悉各種信息資源的特性,清楚相似信息在不同資源類型中的具體表現(xiàn)及不同信息源之間存在的聯(lián)系。然后,根據(jù)待分析問(wèn)題選取恰當(dāng)?shù)男畔。此外,研究人員要將不同信息源分析出的結(jié)果進(jìn)行有效的組織、綜合、解釋,尤其是結(jié)論發(fā)生矛盾時(shí),能夠識(shí)別不當(dāng)結(jié)果,確保分析結(jié)果的準(zhǔn)確性是非常關(guān)鍵的。
3.3加強(qiáng)對(duì)數(shù)據(jù)的清洗與過(guò)濾處理
科技情報(bào)研究人員在大數(shù)據(jù)時(shí)代面臨著海量的處理數(shù)據(jù),這些數(shù)據(jù)通常良莠不齊,可能造成分析結(jié)果錯(cuò)誤,降低決策的正確性。大多數(shù)數(shù)據(jù)庫(kù)具有動(dòng)態(tài)特征,很多數(shù)據(jù)是冗余的、不完整的,甚至是不正確的,從而給數(shù)據(jù)的識(shí)別發(fā)現(xiàn)造成困難。為此,在進(jìn)行數(shù)據(jù)挖掘處理時(shí)可先對(duì)數(shù)據(jù)作預(yù)處理,即數(shù)據(jù)凈化與過(guò)濾,將部分無(wú)關(guān)數(shù)據(jù)刪除。加強(qiáng)對(duì)數(shù)據(jù)質(zhì)量的管控,從而增強(qiáng)數(shù)據(jù)分析的準(zhǔn)確性,提升情報(bào)工作效率。這是由于數(shù)據(jù)的體量?jī)H僅屬于大數(shù)據(jù)的一個(gè)特征,大數(shù)據(jù)的核心價(jià)值在于數(shù)據(jù)的價(jià)值、傳遞速度以及持續(xù)性。
4結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代促使宏觀經(jīng)濟(jì)環(huán)境發(fā)生了顯著的變化,為科技情報(bào)研究工作帶來(lái)了新機(jī)遇與新挑戰(zhàn)。為此,科技情報(bào)研究人員應(yīng)具備大數(shù)據(jù)意識(shí),合理運(yùn)用大數(shù)據(jù)技術(shù)開(kāi)展科技情報(bào)研究工作,不斷提高科技情報(bào)研究結(jié)果的準(zhǔn)確性、科學(xué)性與合理性,最大限度挖掘出科技情報(bào)研究的內(nèi)在價(jià)值,促進(jìn)社會(huì)生產(chǎn)力的轉(zhuǎn)型升級(jí)。
參考文獻(xiàn):
[1]彭家義.淺析大數(shù)據(jù)時(shí)代科技情報(bào)工作面臨的機(jī)遇與挑戰(zhàn)[J].低碳世界,2017,35(28):289-290.
[2]夏雪.基于大數(shù)據(jù)的科技情報(bào)研究芻議[J].江蘇航空,2014,16(2):21-23.
[3]原毅玲.大數(shù)據(jù)時(shí)代科技情報(bào)研究工作探索[J].信息技術(shù)與標(biāo)準(zhǔn)化,2015,22(7):46-48.
[4]蔣卓然.“大數(shù)據(jù)”時(shí)代情報(bào)工作面臨的機(jī)遇與挑戰(zhàn)[J].吉林廣播電視大學(xué)學(xué)報(bào),2016,11(4):73-75.
[5]姚旭.基于大數(shù)據(jù)環(huán)境下的科技信息方法研究[J].決策與信息,2015,21(3):152-153.
作者:王榮花
轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/25819.html