本文摘要:摘要:在信息時代背景下大數(shù)據(jù)技術(shù)得到快速發(fā)展,在諸多領(lǐng)域發(fā)揮出越來越重要的作用。大數(shù)據(jù)時代的到來對科技情報研究提供了更多新思路與新方向。為此,就大數(shù)據(jù)的概念以及在科技情報研究領(lǐng)域的應用技術(shù)進行論述,并探討了大數(shù)據(jù)時代背景下科技情報研究工作的
摘要:在信息時代背景下大數(shù)據(jù)技術(shù)得到快速發(fā)展,在諸多領(lǐng)域發(fā)揮出越來越重要的作用。大數(shù)據(jù)時代的到來對科技情報研究提供了更多新思路與新方向。為此,就大數(shù)據(jù)的概念以及在科技情報研究領(lǐng)域的應用技術(shù)進行論述,并探討了大數(shù)據(jù)時代背景下科技情報研究工作的對策。
關(guān)鍵詞:大數(shù)據(jù);科技情報研究;對策
0引言
隨著網(wǎng)絡信息技術(shù)的快速發(fā)展以及海量數(shù)據(jù)處理能力的增強,進入了大數(shù)據(jù)時代。在大數(shù)據(jù)時代促使產(chǎn)業(yè)提升、科技發(fā)展的一個有效手段就是探索基于大數(shù)據(jù)處理技術(shù)的動態(tài)情報解決策略。伴隨移動終端與智能手機的大范圍普及,公眾自身的信息數(shù)據(jù)都可能成為被記錄與分析的數(shù)據(jù)。這給科技情報研究工作帶來了新機遇與新挑戰(zhàn)。
1大數(shù)據(jù)的定義與特點
關(guān)于大數(shù)據(jù)的定義尚未形成統(tǒng)一的標準,主流觀點認為這是一種數(shù)據(jù)量非常大、數(shù)據(jù)形式多元化的非結(jié)構(gòu)化數(shù)據(jù)。維基百科中將大數(shù)據(jù)定義為所包含的數(shù)據(jù)量規(guī)模龐大到難以通過當前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營決策目的的資訊[1]。
情報論文投稿刊物:《廣東科技》(半月刊)創(chuàng)于1992年,是由廣東省科技廳主管、廣東省科技情報研究所主辦的綜合性科技刊物,國內(nèi)外公開發(fā)行的廣東省唯一綜合性省級科技刊物,是反映廣東省科技與經(jīng)濟發(fā)展的窗口。本刊堅持以促進科技成果轉(zhuǎn)化、科技創(chuàng)新為目標,融新聞、科技、經(jīng)濟、信息、產(chǎn)業(yè)、市場、服務為一體,內(nèi)容豐富、時代感強,是推動科技進步、加強技術(shù)創(chuàng)新、發(fā)展高科技、實現(xiàn)產(chǎn)業(yè)化的重要宣傳陣地。
它的特征可歸納為“4V”:①Volume。數(shù)據(jù)容量巨大,搜集與分析的數(shù)據(jù)量巨大,一般數(shù)據(jù)量規(guī)?沙^10TB。②Variety。數(shù)據(jù)種類多,來源廣,格式多元化。③Velocity。數(shù)據(jù)流動速度快,大數(shù)據(jù)通常是以數(shù)據(jù)流的形式出現(xiàn),數(shù)據(jù)流動速度極快,傳統(tǒng)系統(tǒng)難以處理。④Value。價值密度低,盡管數(shù)據(jù)量呈指數(shù)級增長,但隱藏在其中的有用信息并未實現(xiàn)對應比例增長,反而增加了獲取有用信息的難度[2]?梢姡M管大數(shù)據(jù)擁有很好的潛在價值,但若受限于傳統(tǒng)思維與技術(shù),則容易被淹沒在數(shù)據(jù)海洋中,難以獲取有用信息。
2科技情報研究工作中應用的大數(shù)據(jù)技術(shù)
2.1數(shù)據(jù)挖掘研究技術(shù)
從廣義上來講,數(shù)據(jù)挖掘是指知識的發(fā)現(xiàn)過程是從大量的、有噪聲的、不完全的、模糊的、隨機的實際應用數(shù)據(jù)中提取出人們事先不知、隱含在其中但有用的信息與知識的過程。該技術(shù)涉及到的學科領(lǐng)域很多,除了統(tǒng)計學、算法外,還包括數(shù)據(jù)庫、機器學習、模式識別、高性能計算等技術(shù)[3]。
根據(jù)數(shù)據(jù)挖掘的定義可以發(fā)現(xiàn)它與情報研究有著密切的關(guān)聯(lián)。利用數(shù)據(jù)挖掘技術(shù)能夠有效解決情報研究問題。運用該技術(shù)對目標關(guān)聯(lián)規(guī)劃進行研究,進而發(fā)現(xiàn)科技情報中存在的轉(zhuǎn)換關(guān)系。根據(jù)科技情報研究工作的需要,運用大數(shù)據(jù)技術(shù)開發(fā)相關(guān)數(shù)據(jù)挖掘工具,借助智能化輔助分析功能,提高科技研究人員的工作效率,縮短研究時間。將數(shù)據(jù)挖掘技術(shù)應用于科技情報研究工作中,首先對研究任務做好種類劃分,運用數(shù)據(jù)挖掘技術(shù)的類別功能,歸納整理這些研究任務的共同點與差異性,構(gòu)建數(shù)據(jù)挖掘技術(shù)適用于科技情報研究工作的適用標準。然后,數(shù)據(jù)挖掘技術(shù)的組合形式及相關(guān)算法應圍繞研究任務的實際情況作出恰當?shù)男拚,對挖掘?shù)據(jù)進行合理評價等等,這些都是科技情報研究工作對數(shù)據(jù)挖掘技術(shù)提出的要求。
2.2智能化研究技術(shù)
智能化技術(shù)涉及領(lǐng)域廣泛,涵蓋了神經(jīng)網(wǎng)絡、網(wǎng)絡分析、機器學習、模式識別、遺傳算法、預測建模等諸多學科知識。運用智能化技術(shù)開展科技情報研究工作,可實現(xiàn)對高級、復雜信息的智能化分析處理[4]。這能夠減輕工作人員的工作強度,使其有更多精力去研究方法的優(yōu)化以及研究結(jié)果的應用。在信息技術(shù)高速發(fā)展的背景下,科技情報研究對象不再局限于傳統(tǒng)的報刊雜志書籍,還應注重網(wǎng)絡信息,比如網(wǎng)絡上的圖片、音頻、視頻等信息。運用相關(guān)技術(shù)手段對上述網(wǎng)絡信息數(shù)據(jù)進行結(jié)構(gòu)化處理,為智能化技術(shù)的應用做好準備。面對多元化的數(shù)據(jù)時,智能化技術(shù)應根據(jù)對象來分析,從語義層面上給予技術(shù)支持。
此外,傳統(tǒng)的統(tǒng)計分析難以適應信息海量增長的時代需要,而應借助機器學習、模式識別等技術(shù)來開展科技情報研究工作。運用智能化技術(shù)能夠避免很多人為因素的干擾,提高研究結(jié)果的準確性與真實性。
2.3可視化技術(shù)
科技情報研究對象具有信息分散、數(shù)據(jù)結(jié)構(gòu)多樣的特點,過去主要以人工分析為主,容易受到各種非結(jié)構(gòu)性與不確定性因素的干擾,因此,很難形成規(guī)則的分析模式與分析流程,從而增大了數(shù)據(jù)挖掘規(guī)則的難度。基于此,可通過可視化數(shù)據(jù)分析技術(shù)來解決,構(gòu)建完整的可視化圖表進行分析。通過圖表可以了解全部數(shù)據(jù)信息,而且也能看到數(shù)據(jù)分析的過程以及數(shù)據(jù)鏈的走向,便于研究人員對數(shù)據(jù)進行關(guān)聯(lián)性分析,再輔以人工操作?梢暬脚_具有多種視圖,用于顯示數(shù)據(jù)信息,利用網(wǎng)絡分析、空間分析、信息分析等研究手段來協(xié)調(diào)人機間的交互溝通,便于工作人員對分析結(jié)果的理解與運用。
3大數(shù)據(jù)時代做好科技情報研究工作的對策
3.1強化大數(shù)據(jù)觀念科技情報研究人員首先要樹立起大數(shù)據(jù)意識,充分認識到大數(shù)據(jù)對科技情報研究工作帶來的機遇與挑戰(zhàn),掌握大數(shù)據(jù)技術(shù),善于運用這些技術(shù)來挖掘分析科技情報信息。為此,科技情報研究所應加強對工作人員的教育培訓,組織他們學習大數(shù)據(jù)技術(shù),了解各種大數(shù)據(jù)分析技術(shù)方法,提高大數(shù)據(jù)應用水平,更好地推動科技情報研究工作的開展。
3.2科學利用各種數(shù)據(jù)源
情報研究的結(jié)果會對社會產(chǎn)生深遠的影響,因此,必須確保情報分析結(jié)果準確可靠。這需要從源頭抓起,在分析數(shù)據(jù)的過程中加以完善與豐富。情報研究工作比較復雜,各種信息源的特性也明顯不同,因此,綜合運用多種信息源已成為科技情報研究的重要趨勢[5]。
研究人員需從問題出發(fā),將全部信息資源進行系統(tǒng)化整合,用于情報研究。其中,信息源不僅包括學術(shù)論文、專利等文獻資源,也包括文本、數(shù)據(jù)、各種正式或非正式出版物。研究人員應先熟悉各種信息資源的特性,清楚相似信息在不同資源類型中的具體表現(xiàn)及不同信息源之間存在的聯(lián)系。然后,根據(jù)待分析問題選取恰當?shù)男畔。此外,研究人員要將不同信息源分析出的結(jié)果進行有效的組織、綜合、解釋,尤其是結(jié)論發(fā)生矛盾時,能夠識別不當結(jié)果,確保分析結(jié)果的準確性是非常關(guān)鍵的。
3.3加強對數(shù)據(jù)的清洗與過濾處理
科技情報研究人員在大數(shù)據(jù)時代面臨著海量的處理數(shù)據(jù),這些數(shù)據(jù)通常良莠不齊,可能造成分析結(jié)果錯誤,降低決策的正確性。大多數(shù)數(shù)據(jù)庫具有動態(tài)特征,很多數(shù)據(jù)是冗余的、不完整的,甚至是不正確的,從而給數(shù)據(jù)的識別發(fā)現(xiàn)造成困難。為此,在進行數(shù)據(jù)挖掘處理時可先對數(shù)據(jù)作預處理,即數(shù)據(jù)凈化與過濾,將部分無關(guān)數(shù)據(jù)刪除。加強對數(shù)據(jù)質(zhì)量的管控,從而增強數(shù)據(jù)分析的準確性,提升情報工作效率。這是由于數(shù)據(jù)的體量僅僅屬于大數(shù)據(jù)的一個特征,大數(shù)據(jù)的核心價值在于數(shù)據(jù)的價值、傳遞速度以及持續(xù)性。
4結(jié)語
大數(shù)據(jù)時代促使宏觀經(jīng)濟環(huán)境發(fā)生了顯著的變化,為科技情報研究工作帶來了新機遇與新挑戰(zhàn)。為此,科技情報研究人員應具備大數(shù)據(jù)意識,合理運用大數(shù)據(jù)技術(shù)開展科技情報研究工作,不斷提高科技情報研究結(jié)果的準確性、科學性與合理性,最大限度挖掘出科技情報研究的內(nèi)在價值,促進社會生產(chǎn)力的轉(zhuǎn)型升級。
參考文獻:
[1]彭家義.淺析大數(shù)據(jù)時代科技情報工作面臨的機遇與挑戰(zhàn)[J].低碳世界,2017,35(28):289-290.
[2]夏雪.基于大數(shù)據(jù)的科技情報研究芻議[J].江蘇航空,2014,16(2):21-23.
[3]原毅玲.大數(shù)據(jù)時代科技情報研究工作探索[J].信息技術(shù)與標準化,2015,22(7):46-48.
[4]蔣卓然.“大數(shù)據(jù)”時代情報工作面臨的機遇與挑戰(zhàn)[J].吉林廣播電視大學學報,2016,11(4):73-75.
[5]姚旭.基于大數(shù)據(jù)環(huán)境下的科技信息方法研究[J].決策與信息,2015,21(3):152-153.
作者:王榮花
轉(zhuǎn)載請注明來自發(fā)表學術(shù)論文網(wǎng):http:///jjlw/25819.html