本文摘要:摘 要:[目的 / 意義]本文 旨在研究開放式科學(xué)數(shù)據(jù)管理平臺(tái)的先進(jìn)做法,為國內(nèi)建設(shè)科學(xué)數(shù)據(jù)管理平臺(tái),實(shí)現(xiàn)科研模式的數(shù)字化、開放化和社群化提供借鑒。[方法 / 過程]本文對(duì)國內(nèi)外科學(xué)數(shù)據(jù)管理平臺(tái)的相關(guān)研究文獻(xiàn)進(jìn)行分析,并采用探索性單案例研究法,總結(jié)知名科學(xué)數(shù)據(jù)
摘 要:[目的 / 意義]本文 旨在研究開放式科學(xué)數(shù)據(jù)管理平臺(tái)的先進(jìn)做法,為國內(nèi)建設(shè)科學(xué)數(shù)據(jù)管理平臺(tái),實(shí)現(xiàn)科研模式的數(shù)字化、開放化和社群化提供借鑒。[方法 / 過程]本文對(duì)國內(nèi)外科學(xué)數(shù)據(jù)管理平臺(tái)的相關(guān)研究文獻(xiàn)進(jìn)行分析,并采用探索性單案例研究法,總結(jié)知名科學(xué)數(shù)據(jù)管理平臺(tái)“DigitalCommons Data”的運(yùn)營機(jī)制、建設(shè)模式及服務(wù)功能。[結(jié)果 / 結(jié)論]開放社區(qū)平臺(tái)通過數(shù)據(jù)共享和群體協(xié)作發(fā)揮科學(xué)數(shù)據(jù)的最大利用價(jià)值。以企業(yè)為主體進(jìn)行市場(chǎng)化運(yùn)作是實(shí)現(xiàn)科學(xué)數(shù)據(jù)管理平臺(tái)“社區(qū)化”建設(shè)的有效途徑;多領(lǐng)域、全球化是提高平臺(tái)開放性的關(guān)鍵所在 ; 關(guān)聯(lián)應(yīng)用、定制推送是平臺(tái)專業(yè)服務(wù)的基本保障 ; 數(shù)據(jù)安全是平臺(tái)建設(shè)的重中之重。
關(guān)鍵詞:開放科學(xué) 科學(xué)數(shù)據(jù)管理 Digital Commons Data 數(shù)據(jù)共享
0 引 言
大數(shù)據(jù)時(shí)代推動(dòng)了科學(xué)研究組織范式的不斷演進(jìn),全球化趨勢(shì)下的科研合作帶來了更大范圍與更深層次的知識(shí)創(chuàng)造與共享,科學(xué)領(lǐng)域的開放程度日益提升,科學(xué)研究正由封閉模式轉(zhuǎn)向開放模式。在此背景下,美國、歐盟和日本等陸續(xù)實(shí)施了以推動(dòng)“開放科學(xué)數(shù)據(jù)”為核心的“開放科學(xué)”戰(zhàn)略。眾多高校、科研院所等機(jī)構(gòu)采取了基于建設(shè)數(shù)據(jù)共享平臺(tái)的數(shù)據(jù)驅(qū)動(dòng)發(fā)展模式,掌握開放共享的主動(dòng)權(quán),以實(shí)現(xiàn)更高效的科研管理[1]。截至 2022 年 2 月,全球 80 多個(gè)國家和地區(qū)在國際研究數(shù)據(jù)倉儲(chǔ)注冊(cè)系統(tǒng) re3data.org 中注冊(cè)的科學(xué)數(shù)據(jù)倉儲(chǔ)數(shù)量達(dá)到 3810 個(gè),我國注冊(cè)數(shù)量為 49 個(gè),約占 1.29%[2]。
隨著開放科學(xué)戰(zhàn)略的發(fā)展,科學(xué)數(shù)據(jù)在網(wǎng)上進(jìn)行開放共享、眾籌、眾包。OpenAIRE 的調(diào)查顯示,一種“開放身份、開放報(bào)告、開放參與、開放互動(dòng)、開放預(yù)審稿、開放最終版本評(píng)論、開放平臺(tái)”的 Open Peer Review 模式成為了未來科研活動(dòng)的發(fā)展趨勢(shì)[3]。這種開放參與和開放互動(dòng)需要一個(gè)開放的“平臺(tái)社區(qū)”來支持科研人員進(jìn)行互惠式的討論,以及數(shù)據(jù)資源的交互分享[4]。因此,科學(xué)數(shù)據(jù)管理平臺(tái)的發(fā)展趨勢(shì)也不再僅止于數(shù)據(jù)的共享與再利用,而是嘗試打造科研群組共享的“社區(qū)化”平臺(tái),通過科研眾包和群體協(xié)作,為科研人員提供充分便利的數(shù)據(jù)共享和群體協(xié)作。本文針對(duì)“開放科學(xué)戰(zhàn)略下如何進(jìn)行科學(xué)數(shù)據(jù)管理的社區(qū)化建設(shè)”這一問題,采用探索性單案例研究方法,以“Digital Commons Data”平臺(tái)為例總結(jié)國外科學(xué)數(shù)據(jù)管理平臺(tái)“社區(qū)化”建設(shè)模式,以期為國內(nèi)科學(xué)數(shù)據(jù)管理平臺(tái)的“社區(qū)化”建設(shè)提供參考。
1 文獻(xiàn)綜述
國外啟動(dòng)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)時(shí)間較早且相對(duì)成熟,已進(jìn)入快速發(fā)展階段。而國內(nèi)的科學(xué)數(shù)據(jù)管理平臺(tái)目前仍處于積極建設(shè)階段,已建成的平臺(tái)主要具備數(shù)據(jù)提交、收集、組織、存儲(chǔ)、管理、分析、共享及發(fā)布等功能。從已發(fā)表的研究文獻(xiàn)來看,目前國內(nèi)外關(guān)于科學(xué)數(shù)據(jù)管理平臺(tái)的研究主要集中在以下四個(gè)方面:
(1)平臺(tái)的功能定位和特點(diǎn)研究。Lee J.-S 和 Jeng W 指出,美國校際社會(huì)科學(xué)數(shù)據(jù)共享聯(lián)盟存儲(chǔ)庫 ICPSR 是全球最大的社會(huì)科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施 , 存儲(chǔ)了超過 50 萬個(gè)文件的社科數(shù)據(jù)[5];Scot M 指出,英國數(shù)據(jù)存檔庫 UKDA 解決了諸如數(shù)據(jù)收集、存放等問題,并通過元數(shù)據(jù)制作促進(jìn)了數(shù)據(jù)二次分析和定性材料的再利用[6];另外,普渡大學(xué) PURR 平臺(tái)、Dataone 等平臺(tái)的目標(biāo)均是實(shí)現(xiàn)科學(xué)數(shù)據(jù)的安全存儲(chǔ)和共享[7];項(xiàng)英[8]、張慧[9]、朱玲[10]以及衛(wèi)軍朝[7]等分別研究了國內(nèi)的科學(xué)數(shù)據(jù)管理平臺(tái),認(rèn)為武漢大學(xué)社會(huì)科學(xué)數(shù)據(jù)管理平臺(tái)、北京大學(xué)開放研究數(shù)據(jù)平臺(tái)、中國科學(xué)院科學(xué)數(shù)據(jù)管理平臺(tái)等的主要功能是實(shí)現(xiàn)數(shù)據(jù)的保存和管理;Steinhart G 和 DietrichD 等人研究了美國康奈爾大學(xué) DataStaR 存儲(chǔ)庫在研究數(shù)據(jù)整個(gè)生命周期中的作用[11];Wilson J指出,英國牛津大學(xué)嵌入式機(jī)構(gòu)數(shù)據(jù)監(jiān)管服務(wù) EIDCSR 旨在確保數(shù)據(jù)生命周期各個(gè)階段生成的研究數(shù)據(jù)可以得到安全的保存和記錄,以備未來使用[12];張計(jì)龍認(rèn)為,國內(nèi)部分平臺(tái),如復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)管理平臺(tái),也在逐步從數(shù)據(jù)的保存和共享過渡到為科研活動(dòng)提供全周期服務(wù)中[13]。
(2)平臺(tái)開發(fā)模式和技術(shù)選型研究。概括而言,國內(nèi)外科學(xué)數(shù)據(jù)管理平臺(tái)的構(gòu)建主要有自主開發(fā)、商業(yè)軟件購買和在成熟的開源數(shù)字資產(chǎn)系統(tǒng)上進(jìn)行二次開發(fā)三種方式。如:哈佛大學(xué)自主開發(fā)了 Dataverse[14],復(fù)旦大學(xué)[13]、北京大學(xué)[15]則購買了 Dataverse 軟件作為科學(xué)數(shù)據(jù)管理基礎(chǔ)平臺(tái),康奈爾大學(xué)的 DataStaR 是以自主開發(fā)的開源軟件 Fedora 作為科學(xué)數(shù)據(jù)管理基礎(chǔ)平臺(tái)[16],武漢大學(xué)是基于 Dspace 進(jìn)行了二次開發(fā)[17],中國科學(xué)院的科學(xué)數(shù)據(jù)管理平臺(tái)則是以自主開發(fā)為主[7]。
(3)平臺(tái)績效評(píng)估體系研究。司莉[18]和周宇[19]等人基于層次分析法構(gòu)建了科學(xué)數(shù)據(jù)管理平臺(tái)的績效評(píng)估體系,主要評(píng)價(jià)指標(biāo)涉及數(shù)據(jù)資源、數(shù)據(jù)管理制度、平臺(tái)功能、服務(wù)效能、平臺(tái)界面和軟件系統(tǒng)等;辛一研究了我國九個(gè)省份的科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè),并從網(wǎng)站頁面、數(shù)據(jù)資源、數(shù)據(jù)獲取、共享服務(wù)等方面構(gòu)建了評(píng)價(jià)體系[20]。(4)開放科學(xué)背景下,平臺(tái)的數(shù)據(jù)共享模式研究。
馬合等指出,從 20 世紀(jì)中葉起,美國、澳大利亞和一些歐洲國家如英法德等相繼制定了一系列科學(xué)數(shù)據(jù)管理和開放政策來推動(dòng)科學(xué)數(shù)據(jù)管理的開放與共享建設(shè)[21];我國在“十四五”規(guī)劃中也提出了構(gòu)建國家科研論文和科技信息高端交流平臺(tái)、建設(shè)國家數(shù)據(jù)統(tǒng)一共享開放平臺(tái)、保障國家數(shù)據(jù)安全[22];Wilson J[12]和 Ayris P[23]等指出英國牛津大學(xué)嵌入式機(jī)構(gòu)數(shù)據(jù)監(jiān)管服務(wù) EIDCSR 以及歐洲開放科學(xué)云 EOSC 等平臺(tái)均建設(shè)了共享和開放的數(shù)據(jù)環(huán)境;LeeJ.-S 和 Jeng W 還研究了開放科學(xué)背景下 ICPSR 35 年的歸檔數(shù)據(jù),揭示了代表數(shù)據(jù)共享趨勢(shì)的數(shù)據(jù)特征[5];Maynard M 指出 Data-PASS 采用了開放、低壁壘的合作模式且其成員能夠互補(bǔ)[24]。
總體來看,國內(nèi)外現(xiàn)有的對(duì)科學(xué)數(shù)據(jù)管理平臺(tái)的研究主要集中在平臺(tái)功能、開發(fā)模式、績效評(píng)價(jià)、數(shù)據(jù)共享模式等方面。雖然已有不少學(xué)者提到了在開放科學(xué)背景下科學(xué)數(shù)據(jù)共享的重要性和必要性,但是目前國內(nèi)外科學(xué)數(shù)據(jù)共享模式的研究主要集中在如政策倡導(dǎo)型數(shù)據(jù)共享、開放科學(xué)電子基礎(chǔ)設(shè)施共享、開放共享數(shù)據(jù)環(huán)境建設(shè)以及低壁壘合作數(shù)據(jù)共享等。在實(shí)際建設(shè)中,由于數(shù)據(jù)開放共享政策不統(tǒng)一、不同利益相關(guān)者需求不同,目前國內(nèi)外科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)仍存在數(shù)據(jù)來源單一、數(shù)據(jù)共享政策不完善、共享機(jī)制不健全、數(shù)據(jù)管理流程與規(guī)范不成熟等諸多問題。對(duì)于科學(xué)數(shù)據(jù)管理平臺(tái),以數(shù)據(jù)管理者需求為導(dǎo)向,構(gòu)建“社區(qū)化”合作共享機(jī)制,是推動(dòng)科學(xué)數(shù)據(jù)共享的有益探索。
目前,僅有美國地球數(shù)據(jù)觀測(cè)網(wǎng) Data One Community、Dryad Community[7]和 Digital CommonsData 三個(gè)平臺(tái)建設(shè)了“開放社區(qū)”功能。這三個(gè)平臺(tái)可以分為兩種發(fā)展模式,一種以“推動(dòng)平臺(tái)發(fā)展”為主,另一種以“推動(dòng)數(shù)據(jù)交流”為主。兩種發(fā)展模式存在較大不同,前者面向平臺(tái)合作伙伴,后者面向所有科研人員;前者旨在推動(dòng)平臺(tái)的發(fā)展,后者旨在推動(dòng)科研人員的數(shù)據(jù)交流。以“推動(dòng)數(shù)據(jù)交流”為主的科學(xué)數(shù)據(jù)管理“開放社區(qū)”平臺(tái)順應(yīng)了科研模式的數(shù)字化、開放化和社群化要求,能夠有效地增強(qiáng)科研共同體建設(shè),提升科研質(zhì)量[25]。目前我國的科學(xué)數(shù)據(jù)管理平臺(tái)服務(wù)對(duì)象多局限于國內(nèi)或本?蒲腥藛T,尚未形成面向全球科研人員的“社區(qū)化”平臺(tái),因而,學(xué)習(xí)科學(xué)數(shù)據(jù)管理平臺(tái)“社區(qū)化”建設(shè)經(jīng)驗(yàn)對(duì)加強(qiáng)我國的科學(xué)數(shù)據(jù)、科研人員的交流與共享具有非常重要的現(xiàn)實(shí)意義。本文通過單案例研究法,對(duì)“Digital Commons Data”進(jìn)行系統(tǒng)調(diào)研與分析,以期為推動(dòng)國內(nèi)科學(xué)數(shù)據(jù)管理平臺(tái)“社區(qū)化”建設(shè)提供借鑒。
2 研究設(shè)計(jì)
2.1 研究方法和案例選擇
本文采用單一案例研究方法,選取具有代表性、典型性和啟發(fā)性的案例,以“增強(qiáng)對(duì)同類事物的理解”[26]。本文選取 Digital Commons Data 平臺(tái)作為案例研究對(duì)象,探索開放科學(xué)戰(zhàn)略下如何進(jìn)行科學(xué)數(shù)據(jù)管理“社區(qū)化”建設(shè)。其作為科學(xué)數(shù)據(jù)管理“社區(qū)化”建設(shè)的典型代表主要體現(xiàn)在以下兩方面:(1)具備開放科學(xué)戰(zhàn)略所要求的典型功能。它是由荷蘭 Elsevier 公司自主開發(fā)的面向政府機(jī)構(gòu)、高校、科研院所或企業(yè)用戶進(jìn)行科學(xué)數(shù)據(jù)管理的服務(wù)平臺(tái),既能存儲(chǔ)科學(xué)數(shù)據(jù),也可以在線進(jìn)行學(xué)術(shù)溝通交流,用戶還可以基于該平臺(tái)建設(shè)自己的數(shù)據(jù)一體化系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)的生產(chǎn)、管理、傳播和評(píng)估等功能。(2)“社區(qū)化”建設(shè)的典型性。Digital Commons Data 對(duì)接了全球超過1700 個(gè)數(shù)據(jù)存儲(chǔ)庫,來自世界各地的 600 多萬名研究人員在平臺(tái)上分享創(chuàng)意、了解領(lǐng)域新事物、探討領(lǐng)域發(fā)展動(dòng)態(tài)、尋找創(chuàng)新研究途徑。已有文獻(xiàn)關(guān)于 Digital Commons Data 平臺(tái)的研究主要集中在對(duì)其閱讀指標(biāo)應(yīng)用的探索以及對(duì)其數(shù)據(jù)治理流程的分析,從科學(xué)數(shù)據(jù)管理平臺(tái)的“社區(qū)化建設(shè)”角度進(jìn)行研究是一個(gè)全新的視角,將會(huì)帶來全新的認(rèn)識(shí)。
2.2 數(shù)據(jù)收集與分析
在資料獲取上,本文采取了訪談和文獻(xiàn)資料收集相結(jié)合的方法。本文選取了荷蘭 Elsevier 上海分公司和北京分公司的 Digital Commons Data 產(chǎn)品負(fù)責(zé)人、開發(fā)工程師以及上海一流大學(xué)建設(shè)高校 A 大學(xué)的科研數(shù)據(jù)管理專家共 6 人作為訪談對(duì)象,以“Digital Commons Data 開放社區(qū)的運(yùn)營建設(shè)模式與服務(wù)功能”為切入點(diǎn),采取半結(jié)構(gòu)式訪談法,同時(shí),對(duì)訪談中遇到的相關(guān)主題進(jìn)行拓展與追問。此外,從 Digital Commons Data 官網(wǎng)、Digital Commons Data 產(chǎn)品介紹、新聞報(bào)道以及相關(guān)研究成果中獲取文獻(xiàn)資料。通過對(duì)資料的篩選、翻譯與整合,建立能夠相對(duì)全面描繪 Digital Commons Data 平臺(tái)運(yùn)營與服務(wù)機(jī)制的案例資料庫。在對(duì)訪談?dòng)涗涍M(jìn)行整理時(shí),本文采取了三級(jí)編碼的方式。一級(jí)編碼是開放式編碼,基于前期廣泛收集的原始數(shù)據(jù)資料,經(jīng)過編碼與整合 , 提煉概括了 28 個(gè)概念化類屬(A1-A28)。二級(jí)編碼是主軸式編碼,在一級(jí)編碼的基礎(chǔ)上,對(duì)形成的 28 個(gè)概念化類屬進(jìn)行對(duì)比和歸納,總結(jié)出 8 個(gè)范疇化類屬(B1-B8)。三級(jí)編碼是選擇式編碼,在二級(jí)編碼的基礎(chǔ)上,建立各范疇之間的聯(lián)系,形成 3 個(gè)核心類屬(C1-C3)。
3 案例描述與分析
3.1 Digital Commons Data 開放社區(qū)的運(yùn)營機(jī)制Digital Commons Data 平臺(tái)的建設(shè)理念在于實(shí)現(xiàn)科學(xué)數(shù)據(jù)的充分利用(A3),幫助用戶對(duì)科學(xué)數(shù)據(jù)進(jìn)行全生命周期管理(A4),使科研人員能夠隨時(shí)隨地、安全地訪問和共享信息(A6、A7)。另外,Digital Commons Data 旨在實(shí)現(xiàn)科學(xué)數(shù)據(jù)在科研群組內(nèi)的共享,通過打造公共群組,提供相同領(lǐng)域研究人員相互聯(lián)系的專用空間,契合科研合作網(wǎng)絡(luò)生態(tài)。Digital Commons Data 產(chǎn)品研究和開發(fā)的資金主要來自 Elsevier 公司這一市場(chǎng)化主體的自主投入(A8),高校、科研院所、政府單位等若要使用該平臺(tái),需要進(jìn)行服務(wù)購買(A9)。
3.2 Digital Commons Data 開放社區(qū)的建設(shè)模式Digital Commons Data 平臺(tái)在技術(shù)框架上基于云端進(jìn)行分布式部署(A10)和模塊化應(yīng)用(A11),既可以靈活組合也可以與其他科學(xué)數(shù)據(jù)管理(RDM)工具結(jié)合使用(A12、A13)。平臺(tái)對(duì)外提供開放式應(yīng)用程序接口(API)(A14),可以與全球科學(xué)數(shù)據(jù)管理生態(tài)系統(tǒng)和其他 Elsevier科研情報(bào)管理系統(tǒng)集成使用。另外,Digital Commons Data 整合了 Elsevier 投稿系統(tǒng),科研人員在使用 Digital Commons Data 投稿的同時(shí)可以提交研究過程中的數(shù)據(jù)集。
3.3 Digital Commons Data 開放社區(qū)的服務(wù)功能
3.3.1 全球科學(xué)數(shù)據(jù)庫索引Digital Commons Data 收錄了全球 1700 多個(gè)公共數(shù)據(jù)存儲(chǔ)庫中約 2050 萬個(gè)數(shù)據(jù)集(A15),每個(gè)數(shù)據(jù)集均有超過 100GB 的存儲(chǔ)空間,科研人員可以發(fā)布、共享、展示和存儲(chǔ)科研數(shù)據(jù)。平臺(tái)對(duì)其中 35 個(gè)存儲(chǔ)庫的 1000 多萬個(gè)數(shù)據(jù)集進(jìn)行了深度索引(A16),支持多維度檢索,并提供數(shù)據(jù)文件內(nèi)容的在線預(yù)覽,不僅使得科研人員能夠輕松準(zhǔn)確地找到相關(guān)數(shù)據(jù),同時(shí)也顯著提高了科研項(xiàng)目的可見度和影響力。
3.3.2 電子實(shí)驗(yàn)室記錄本作為一個(gè)安全的云存儲(chǔ)庫,可以在平臺(tái)長期存儲(chǔ)科學(xué)數(shù)據(jù),無論用戶在哪里,數(shù)據(jù)都很容易被共享、訪問和使用,獨(dú)立科研人員或團(tuán)體可以在同一位置組織、批注和共享數(shù)據(jù),有效提升了科研人員的工作效率。同時(shí),先進(jìn)的電子實(shí)驗(yàn)室記錄本功能(A18),可以存儲(chǔ)、采集、重現(xiàn)不同版本的科學(xué)數(shù)據(jù)(A19),以支持縱向研究,還可向各級(jí)組織提交一鍵生成的數(shù)據(jù)報(bào)告(A20)。獨(dú)特的 DOI 使得用戶的研究成果與引用數(shù)據(jù)集實(shí)現(xiàn)關(guān)聯(lián)(A17)。
3.3.3 科研形象管理和社交網(wǎng)絡(luò)用戶科研形象的個(gè)性化管理是 Digital Commons Data 平臺(tái)的主要特色之一,通過狀態(tài)查詢,用戶可以查看個(gè)人研究成果的影響力、所在國家、研究領(lǐng)域等[27],還可以與平臺(tái)上志同道合的科研人員進(jìn)行聯(lián)系,進(jìn)一步拓展自己的學(xué)術(shù)研究網(wǎng)絡(luò)。另外,Digital Commons Data 可以設(shè)置不同用戶群組,并給予不同權(quán)限,用戶可閱讀、修改組內(nèi)所有文獻(xiàn)。此外,“Feed”功能可以跟蹤用戶的研究主題與社交網(wǎng)絡(luò),并進(jìn)行相關(guān)研究及新研究人員推薦(A24)。
3.3.4 招聘就業(yè)與基金資助信息服務(wù)
作為一個(gè)學(xué)術(shù)網(wǎng)絡(luò)的社交平臺(tái),借助龐大的用戶體量和科研領(lǐng)域的專業(yè)服務(wù),Digital CommonsData 面向機(jī)構(gòu)和用戶提供雙向招聘就業(yè)服務(wù)。截至 2022 年 2 月,平臺(tái)已發(fā)布 262361 個(gè)科學(xué)、技術(shù)和衛(wèi)生工作的就業(yè)崗位(A26),用戶可根據(jù)地區(qū)或領(lǐng)域進(jìn)行搜索(A27)。同時(shí),Digital Commons Data能夠從 2000 多個(gè)機(jī)構(gòu)及時(shí)收集到基金資助信息,幫助科研人員快速匹配適合申請(qǐng)的基金項(xiàng)目(A28)。
4 結(jié)論與啟示
4.1 市場(chǎng)化運(yùn)作模式是實(shí)現(xiàn)平臺(tái)建設(shè)的有效途徑Digital Commons Data 平臺(tái)是由 Elsevier 公司自主開發(fā)并管理的,政府、高校、科研機(jī)構(gòu)或其他企業(yè)可通過購買服務(wù)的方式使用該平臺(tái)。我國目前的科學(xué)數(shù)據(jù)管理平臺(tái)多集中于科研院所和高等院校,往往基于自身研究需求而建,數(shù)據(jù)孤島的現(xiàn)象普遍存在,開放共享的意識(shí)也還沒有形成。“開放社區(qū)”的本質(zhì)是推進(jìn)科學(xué)數(shù)據(jù)共享,推動(dòng)科研人員群體協(xié)作,借鑒 Digital CommonsData 平臺(tái)的運(yùn)營模式,推進(jìn)以科研人員需求為導(dǎo)向、以企業(yè)為建設(shè)主體的科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè),是實(shí)現(xiàn)“開放社區(qū)”理念和打造優(yōu)質(zhì)服務(wù)功能的重要途徑。
4.2 多領(lǐng)域、全球化是提高平臺(tái)開放性的關(guān)鍵所在Digital Commons Data 平臺(tái)擁有全球 600 多萬名科研用戶,用戶數(shù)量多且覆蓋領(lǐng)域廣,全球化的數(shù)據(jù)共享基本能滿足各個(gè)領(lǐng)域研究人員的科研需求。有學(xué)者研究指出,Digital Commons Data 的訪問量與傳統(tǒng)被引量呈正向強(qiáng)相關(guān)關(guān)系,說明越來越多的研究人員選擇在 Digital Commons Data上閱讀和整理文獻(xiàn),進(jìn)而進(jìn)行引用[28]。目前我國自建的科學(xué)數(shù)據(jù)管理平臺(tái)多集中于某一單一領(lǐng)域,與全球科學(xué)數(shù)據(jù)平臺(tái)的鏈接也比較少,因此打造多領(lǐng)域、全球化的科學(xué)數(shù)據(jù)管理平臺(tái),對(duì)提升用戶覆蓋范圍、融入全球科學(xué)研究生態(tài)體系、提高平臺(tái)影響力具有深遠(yuǎn)的意義。
4.3 關(guān)聯(lián)應(yīng)用、定制推送是平臺(tái)專業(yè)服務(wù)的基本保障Digital Commons Data 平臺(tái)提供各類數(shù)據(jù)應(yīng)用、分析軟件工具及不同版本的應(yīng)用下載和插件說明,為用戶提供一站式的數(shù)據(jù)存儲(chǔ)、分析和應(yīng)用服務(wù)。同時(shí),平臺(tái)還能定制推送關(guān)注領(lǐng)域的發(fā)展動(dòng)態(tài),體現(xiàn)了數(shù)據(jù)共享的拓展形式。我國的科學(xué)數(shù)據(jù)管理平臺(tái)多以存儲(chǔ)功能為主,對(duì)于平臺(tái)的可持續(xù)發(fā)展、功能模塊、用戶體驗(yàn)等方面考慮較少,在數(shù)據(jù)密集型科學(xué)及科學(xué)研究第四范式的推動(dòng)下,以關(guān)聯(lián)應(yīng)用和智能推送為主要服務(wù)模式的平臺(tái)建設(shè),是科學(xué)數(shù)據(jù)管理平臺(tái)提高用戶科研效率、提升科研合作的關(guān)鍵。
4.4 數(shù)據(jù)安全是平臺(tái)建設(shè)的重中之重科學(xué)數(shù)據(jù)是科技創(chuàng)新與發(fā)展的基礎(chǔ)性戰(zhàn)略資源,科學(xué)數(shù)據(jù)安全的影響大至國家安全、產(chǎn)業(yè)安全,小至個(gè)人的合法權(quán)益。Digital Commons Data 可自建群組,將共享數(shù)據(jù)的權(quán)限限制在組內(nèi)成員之間,大大保障了數(shù)據(jù)共享過程中的安全性問題 (A25)。我國科學(xué)數(shù)據(jù)管理平臺(tái)也要將數(shù)據(jù)存儲(chǔ)、傳輸、共享過程中的安全問題作為重中之重,在數(shù)據(jù)脫敏、權(quán)限控制、系統(tǒng) 監(jiān)控等各個(gè)方面健全制度和流程,做好軟硬件保障,保護(hù)科學(xué)數(shù)據(jù)在其全生命周期中免受破壞性外力和非授權(quán)操作的侵害 , 保持科學(xué)數(shù)據(jù)的機(jī)密性、完整性和可用性。本文雖然對(duì) Digital Commons Data 這一平臺(tái)進(jìn)行了較為全面的調(diào)查分析,但限于篇幅,未能對(duì)其他具有代表性的科學(xué)數(shù)據(jù)管理平臺(tái)進(jìn)行調(diào)查和比較研究,因而所得出的經(jīng)驗(yàn)啟示不夠全面。隨著科學(xué)數(shù)據(jù)管理平臺(tái)“開放社區(qū)”建設(shè)的蓬勃發(fā)展,未來將有更多的案例值得進(jìn)一步挖掘與探索,也可以從技術(shù)和結(jié)構(gòu)等更多維度上進(jìn)行拓展。
【參考文獻(xiàn)】
[1]顧立平 . 科研模式變革中的數(shù)據(jù)管理服務(wù) : 實(shí)現(xiàn)開放獲取、開放數(shù)據(jù)、開放科學(xué)的途徑[J]. 中國圖書館學(xué)報(bào) ,2018,44(6):43-58.
[2]re3data.org[EB/OL].[2022-02-14].
[3]Ross-Hellauer T, Deppe A , Schmidt B. Survey on open peer review: Attitudes and experience amongst editors,authors and reviewers [J]. Plos One, 2017, 12(12):e0189311.
[4]嚴(yán)煒煒 , 張敏 . 科研協(xié)同中的數(shù)據(jù)共享與利用行為模式分析[J]. 情報(bào)理論與實(shí)踐 ,2018,41(1):55-60.
[5]Lee J.-S, Jeng W. The landscape of archived studies in a social science data infrastructure: Investigating the ICPSRmetadata records [J].Proceedings of the Association for Information Science and Technology.2019,56(1):147-156.
[6]Scot M. Les archives britanniques des sciences sociales. Deux études de cas: UK Data Archive (UKDA) etQualidata[J]. Genèses, 2006, 63(2):46-65.
[7]衛(wèi)軍朝 , 張春芳 . 國內(nèi)外科學(xué)數(shù)據(jù)管理平臺(tái)比較研究[J]. 圖書情報(bào)知識(shí) ,2017(5):97-107.
[8]項(xiàng)英 , 賴劍菲 , 丁寧 . 高校圖書館科學(xué)數(shù)據(jù)管理服務(wù)實(shí)踐探索——以武漢大學(xué)社會(huì)科學(xué)數(shù)據(jù)管理為例[J].情報(bào)理論與實(shí)踐 ,2013,36(12):89-93.
選自期刊《文獻(xiàn)與數(shù)據(jù)學(xué)報(bào)》第 4 卷 第 2 期
作者信息:王 茜 王 晨(上海市研發(fā)公共服務(wù)平臺(tái)管理中心,上海 200235)
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/30386.html