本文摘要:摘要:[目的/意義]在大數(shù)據(jù)浪潮和新文科背景下,中國圖情檔學科的人才培養(yǎng)范式亟需改革。與此同時,大數(shù)據(jù)相關(guān)專業(yè)的建設(shè)方興未艾,對于圖情檔學科的人才培養(yǎng)新范式建設(shè)具有借鑒意義。[方法/過程]采用一種時序主題網(wǎng)絡(luò)模型及計算方法;通過搜集、處理、統(tǒng)計、分析259所
摘要:[目的/意義]在大數(shù)據(jù)浪潮和“新文科”背景下,中國圖情檔學科的人才培養(yǎng)范式亟需改革。與此同時,大數(shù)據(jù)相關(guān)專業(yè)的建設(shè)方興未艾,對于圖情檔學科的人才培養(yǎng)新范式建設(shè)具有借鑒意義。[方法/過程]采用一種時序主題網(wǎng)絡(luò)模型及計算方法;通過搜集、處理、統(tǒng)計、分析259所高等院校的大數(shù)據(jù)專業(yè)培養(yǎng)方案文本,在時間維度上進行主題挖掘,總結(jié)歸納數(shù)據(jù)科學課程的層次;分析圖情檔學科主干知識與大數(shù)據(jù)專業(yè)的聯(lián)系,并給出適合圖情檔學科的數(shù)據(jù)科學課程建議。[結(jié)果/結(jié)論]結(jié)果表明,所采用的時序主題網(wǎng)絡(luò)模型方法能夠較好地契合大數(shù)據(jù)專業(yè)的人才培養(yǎng)范式發(fā)展分析,可以成為研究學科主題的一種方法。此外,還給出面向圖情檔學科的數(shù)據(jù)科學類課程建議,可供圖情檔學科的人才培養(yǎng)參考。
關(guān)鍵詞:人才培養(yǎng)數(shù)據(jù)科學新文科時序主題網(wǎng)絡(luò)模型
1引言
“新文科”建設(shè)是提升中國國家軟實力、促進文化繁榮的重要部分,也是高質(zhì)量教育體系改革的重點。育人育才是建設(shè)“新文科”的關(guān)鍵點,要做到遵循規(guī)律、協(xié)同育人、模式多元,培養(yǎng)出適應(yīng)新時代要求的應(yīng)用型、復(fù)合型人才。圖書情報與檔案管理(以下簡稱“圖情檔”)學科因為具有天然的文理交叉性,在“新文科”的背景下,人才培養(yǎng)模式必然迎來重大的革新。在數(shù)據(jù)科學剛剛興起時,葉鷹和馬費成指出數(shù)據(jù)科學與信息科學在理論邏輯和技術(shù)方法上一脈相承[1]。
“數(shù)智賦能”已然成為圖情檔學科的新發(fā)展趨勢,孫建軍等[2]認為數(shù)據(jù)管理與數(shù)據(jù)分析技術(shù)為圖情檔學科的發(fā)展提供了新的可能,趙星等[3]也基于數(shù)據(jù)智能和知識發(fā)現(xiàn)提出了圖情檔學科的拓展方向。本研究從圖情檔學科發(fā)展難點出發(fā),借鑒大數(shù)據(jù)專業(yè)人才培養(yǎng)模式的建設(shè)經(jīng)驗。為分析出大數(shù)據(jù)專業(yè)人才培養(yǎng)發(fā)展范式,本研究創(chuàng)新性地利用時序主題網(wǎng)絡(luò)模型,對259所開設(shè)大數(shù)據(jù)專業(yè)院校的培養(yǎng)方案文本進行挖掘,并總結(jié)出其課程的三大層次。為助力圖情檔學科人才培養(yǎng)模式的創(chuàng)新建設(shè),本研究結(jié)合葉鷹[4]總結(jié)的圖情學科主干知識,探索圖情檔的數(shù)據(jù)科學類課程建設(shè)方案,為圖情檔學科人才培養(yǎng)模式的創(chuàng)新發(fā)展提供依據(jù)。
2困境與思考
2.1現(xiàn)實問題
從大多數(shù)院校圖情檔專業(yè)所在院系設(shè)立的本科專業(yè)———信息管理與信息系統(tǒng)專業(yè)的發(fā)展現(xiàn)狀來看,2020年、2021年分別有13所、16所院校撤銷了該專業(yè),在普通高校新增撤銷本科專業(yè)名單中分別排在第3名、第2名。相比之下,大數(shù)據(jù)專業(yè)的開設(shè)情況卻如火如荼,近兩年申請開設(shè)數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)、大數(shù)據(jù)管理與應(yīng)用專業(yè)的學校均超過50所。圖情檔相關(guān)專業(yè)最悲觀的預(yù)測是在10年內(nèi)“消亡、被合并、被替代、改名、被邊緣化”[5]。由此可見,當前圖情檔學科的人才培養(yǎng)模式亟需改革,要順應(yīng)“新文科”的時代洪流推進發(fā)展。
2.2學界思考
自“新文科”提出以來,很多學者都對圖情檔學科的未來發(fā)展提出了新的思考,如初景利[6]提出圖情檔學科要發(fā)展成“硬學科”,要做到堅持內(nèi)核的情況下,強化技術(shù)與方法的引入。馬費成等[7]提出要抓住新文科建設(shè)契機,重視交叉融合,同時要堅守人文傳統(tǒng)。張九珍[8]提出圖情檔在“新文科”背景下的學科交叉融合應(yīng)當做到“以我為主,為我所用”。關(guān)于堅持學科內(nèi)核方面的探討,葉鷹[4]對圖書情報學的主干知識和研究方法進行了總結(jié),為圖情檔學科的發(fā)展明確堅守的依據(jù)。周文杰[9]提到,圖情檔新文科建設(shè)需要堅守的“舊”內(nèi)核包括:基于科學數(shù)據(jù)建設(shè)數(shù)據(jù)科學、作為基礎(chǔ)設(shè)施支持數(shù)字人文、立足知識組織“編制”數(shù)字記憶、堅守公共文化服務(wù)的人文情懷、開掘參考咨詢的循證決策功能。
2.3創(chuàng)新發(fā)展
“新文科”的新是創(chuàng)新的新,“新文科”專業(yè)人才培養(yǎng)模式的建設(shè),可以借鑒和吸取“新工科”專業(yè)的新方法、新技術(shù)。圖情檔學科人才培養(yǎng)新模式的建設(shè),可以結(jié)合大數(shù)據(jù)專業(yè),探索出新的發(fā)展方向。從大數(shù)據(jù)專業(yè)汲取經(jīng)驗的思路并非本研究原創(chuàng),陳沫等[10]研究了情報學取向的數(shù)據(jù)科學與大數(shù)據(jù)專業(yè),依次劃分出了基礎(chǔ)課程、方法類課程和應(yīng)用型課程。
陶俊等[11]分析了國外多所iSchool院校的數(shù)據(jù)科學專業(yè)培養(yǎng)方案,為圖書情報的數(shù)據(jù)科學課程建設(shè)提 供建議。趙星等[12]利用內(nèi)容分析法研究了大數(shù)據(jù)管理與應(yīng)用專業(yè)的培養(yǎng)方案文本。黎海波等[13]研究了信管專業(yè)的數(shù)據(jù)科學課程群建設(shè),為信管專業(yè)人才培養(yǎng)模式提供數(shù)據(jù)科學能力培養(yǎng)的新思路。閆慧等[14]通過設(shè)計民族志未來訪談,判斷出數(shù)據(jù)科學與圖情學科領(lǐng)域?qū)碜羁赡苁遣⒓年P(guān)系。本研究將從大數(shù)據(jù)專業(yè)的人才培養(yǎng)模式中進行探索,為圖情檔學科人才培養(yǎng)模式提供新思路。
3大數(shù)據(jù)專業(yè)的主題分析
3.1大數(shù)據(jù)專業(yè)的基本情況
國內(nèi)大數(shù)據(jù)專業(yè)最早開設(shè)于2016年,具體開設(shè)情況,在2016年,北京大學、對外經(jīng)濟貿(mào)易大學、中南大學首先開設(shè)了數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè),此后在2017-2021年,分別有32所、248所、203所、143所、62所院校開設(shè)了該專業(yè)。該專業(yè)授予的學位分為工學學位和理學學位兩種,廈門大學、中國人民大學、上海財經(jīng)大學等高校同時在理學和工學對應(yīng)的學院開設(shè)該專業(yè)。截至2021年初,開設(shè)該專業(yè)的院校數(shù)量為674所,其中,原“985工程”院校有29所,原“211工程”院校有73所。
大數(shù)據(jù)管理與應(yīng)用專業(yè)誕生于2017年,2018年至2021年的開設(shè)院校數(shù)量分別為5所、25所、52所、68所,截至2021年,共有140所高校開設(shè)了該專業(yè),其中,原“985工程”院校有5所,原“211工程”院校有25所,該專業(yè)授予的學位均為管理學學位。
本研究通過郵件咨詢、院校官網(wǎng)等渠道,對以上大數(shù)據(jù)專業(yè)開設(shè)院校的培養(yǎng)方案進行搜集。其中部分院校的數(shù)據(jù)難以獲取,最終搜集得到了86所大數(shù)據(jù)管理與應(yīng)用專業(yè)開設(shè)院校,173所數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)開設(shè)院校,共259所院校的大數(shù)據(jù)專業(yè)培養(yǎng)方案和核心課程。涵蓋一流大學建設(shè)高校(如北京大學)、一流學科建設(shè)高校(如華中師范大學)、其他省部共建高校(如廣東海洋大學)、省屬高校(如聊城大學)、獨立院校(如集美大學誠毅學院)等多個層次的高校。
3.2大數(shù)據(jù)專業(yè)人才培養(yǎng)模式的主題關(guān)系
為分析大數(shù)據(jù)專業(yè)培養(yǎng)模式的核心主題及整體架構(gòu),本研究基于共現(xiàn)技術(shù)研究大數(shù)據(jù)專業(yè)培養(yǎng)模式各個主題的之間的相互關(guān)系,將培養(yǎng)方案文本進行分詞、去除停用詞、主題標引等預(yù)處理后,對核心主題進行主題關(guān)系挖掘,得到大數(shù)據(jù)專業(yè)人才培養(yǎng)模式主題關(guān)系弦圖。
分別呈現(xiàn)了數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)、大數(shù)據(jù)管理與應(yīng)用專業(yè)的人才培養(yǎng)模式主題,弦的不同弧線代表該專業(yè)培養(yǎng)方案中的重要主題,弧線長度代表主題的重要程度,弦網(wǎng)絡(luò)的密集程度代表不同主題之間的關(guān)聯(lián)緊密性。由分析可知,數(shù)據(jù)科學與大 數(shù)據(jù)技術(shù)專業(yè)人才培養(yǎng)的核心點為數(shù)據(jù)分析,專業(yè)核心技術(shù)是計算機技術(shù)和統(tǒng)計學。大數(shù)據(jù)管理與應(yīng)用專業(yè)人才培養(yǎng)的核心點是數(shù)據(jù)管理,專業(yè)核心技術(shù)是統(tǒng)計學、管理科學和計算機科學。前者重視培養(yǎng)學生的抽象思維能力、數(shù)學形式化思維能力、數(shù)據(jù)科學理論知識、數(shù)據(jù)科學基礎(chǔ)能力等。后者重點培養(yǎng)學生的數(shù)據(jù)采集、數(shù)據(jù)處理和分析、數(shù)據(jù)可視化能力。在大數(shù)據(jù)專業(yè)的培養(yǎng)模式下,學生能夠采用數(shù)據(jù)科學方法對商業(yè)、管理中的復(fù)雜問題或復(fù)雜數(shù)據(jù)工程問題進行研究。
3.3大數(shù)據(jù)專業(yè)人才培養(yǎng)模式的主題演變
S.C.Deerwester等[15]在1990年提出了一種非概率的主題模型潛在語義索引(LatentSemanticIndexing,LSI),而后T.Hofmann[16]實現(xiàn)了基于概率的主題模型,此后基于概率的主題模型逐漸興起。傳統(tǒng)的主題模型不包含時間維度,本研究借鑒廖君華等[17]、A.Bruns[18]、M.J.Westgate等[19]、Z.F.Zhang等[20]、Y.Zheng等[21]研究的時序主題模型,利用切片方法引入時間維度。
3.4大數(shù)據(jù)專業(yè)課程的三大層次
由上文分析可知,大數(shù)據(jù)專業(yè)重視培養(yǎng)學生的基礎(chǔ)數(shù)理能力、數(shù)據(jù)科學思維能力和數(shù)據(jù)科學實踐能力,近年逐漸開始融合社會科學等其他學科的知識,為學生提供更加多元化的發(fā)展路徑,相關(guān)課程也從基礎(chǔ)理論知識、大數(shù)據(jù)基礎(chǔ)應(yīng)用知識演變?yōu)楦訌V泛的知識。陳沫等[10]在研究大數(shù)據(jù)專業(yè)課程體系時,將其劃分為基礎(chǔ)層、方法層、應(yīng)用層共三大層次。
本研究借鑒其思路,并基于前兩節(jié)的主題分析,將大數(shù)據(jù)專業(yè)的核心課程劃分為3個層次,分別是基礎(chǔ)理論與方法層、大數(shù)據(jù)理論與方法層、綜合方法及應(yīng)用層;A(chǔ)理論與方法層的課程注重培養(yǎng)學生的基礎(chǔ)數(shù)理思維和基本數(shù)據(jù)科學素養(yǎng),包括統(tǒng)計學類的課程和算法程序類的課程,例如數(shù)據(jù)結(jié)構(gòu)與算法、Python程序設(shè)計與應(yīng)用等課程。大數(shù)據(jù)理論與方法層是大數(shù)據(jù)專業(yè)的核心課程培養(yǎng)學生數(shù)據(jù)科學及大數(shù)據(jù)的核心素養(yǎng),包括數(shù)據(jù)存儲與管理、數(shù)據(jù)采集與加工、數(shù)據(jù)分析與挖掘、大數(shù)據(jù)技術(shù)4個方面的內(nèi)容。
其中,數(shù)據(jù)存儲與管理包含數(shù)據(jù)庫、數(shù)據(jù)倉庫、Hadoop大數(shù)據(jù)存儲等課程;數(shù)據(jù)采集與加工包含爬蟲、數(shù)據(jù)搜集、信息檢索等課程;數(shù)據(jù)分析與挖掘包含數(shù)據(jù)建模、統(tǒng)計分析、機器學習、數(shù)據(jù)可視化等課程;大數(shù)據(jù)技術(shù)包含基本的大數(shù)據(jù)分析技術(shù)課程,如大數(shù)據(jù)分布式算法等。綜合方法及應(yīng)用層為學生提供了多種方向的選擇(不同院校根據(jù)自身情況開設(shè)),使學生運用數(shù)據(jù)科學的基本知識,在商業(yè)大數(shù)據(jù)、醫(yī)學大數(shù)據(jù)等方向進行實踐,能有效激發(fā)學生的興趣,并提升學生的實踐能力。例如復(fù)旦大學的大數(shù)據(jù)專業(yè)培養(yǎng)方案中,為學生提供了“理醫(yī)工學大數(shù)據(jù)分析模塊”“社會科學大數(shù)據(jù)分析模塊”“類腦計算方向?qū)I(yè)進階模塊”等多個多元發(fā)展路徑的課程選擇。
4圖情檔學科人才培養(yǎng)的創(chuàng)新發(fā)展
4.1圖情檔主干知識與大數(shù)據(jù)專業(yè)的聯(lián)系
在汲取大數(shù)據(jù)專業(yè)建設(shè)經(jīng)驗,建設(shè)圖情檔學科人才培養(yǎng)新模式的過程中,要掌握圖情檔學科人才培養(yǎng)模式的核心立足點。S.R.Ranganathan[23]很早就確立了圖書館學的立學原則,主要集中在圖書服務(wù)方面。隨著時代的發(fā)展,圖情檔學科的核心主題有了一定變化。葉鷹[4]經(jīng)由核心學術(shù)凝聚表達了圖情檔學科的主干知識,層次上包括概念級、理論級、體系級。
首先將核心學術(shù)分為信息組織、信息檢索和信息分析,再分別由3個層次細化。信息組織在概念級細化為分類、標引,在理論級細化為分類法、主題法、編目法、索引法,在體系級細化為文獻體系、知識體系。信息檢索在概念級細化為查準、查全,在理論級細化為布爾檢索等搜索算法,在體系級細化為搜索引擎等檢索系統(tǒng)。信息分析在概念級細化為廣、快、精、準,在理論級細化為引文分析、內(nèi)容分析,在體系級細化為量化分析、質(zhì)性分析;诖,總結(jié)出圖情檔學科人才培養(yǎng)體系的核心主題,主要包括信息組織、信息檢索、信息分析等方面。
需注意的是,不能簡單地從大數(shù)據(jù)專業(yè)照搬一些數(shù)據(jù)科學課程,而是要結(jié)合圖情檔主干知識和院系的具體情況。面向圖情檔的數(shù)據(jù)科學課程在數(shù)據(jù)科學思維和理論層次要求不高,但要重視實踐性與結(jié)合性。在培養(yǎng)學生信息組織能力的數(shù)據(jù)科學課程建設(shè)中,注意將知識圖譜、分類與標引、語義網(wǎng)絡(luò)等方面的內(nèi)容引入相關(guān)課程;培養(yǎng)學生信息檢索能力的數(shù)據(jù)科學課程建設(shè)中,除教學基礎(chǔ)的數(shù)據(jù)搜集與信息檢索內(nèi)容外,還可以結(jié)合深度學習、強化學習等知識,在智能信息檢索、用戶推薦算法領(lǐng)域的應(yīng)用加強教學;培養(yǎng)學生信息分析能力的數(shù)據(jù)科學課程建設(shè)中,可以設(shè)置一些算法與程序課程,例如設(shè)置基于JupyterNotebook平臺的Python程序設(shè)計教學,還可以將前沿的數(shù)據(jù)挖掘算法、自然語言處理、引文網(wǎng)絡(luò)分析的基本內(nèi)容納入課程內(nèi)容。
5結(jié)語
本研究探討了大數(shù)據(jù)專業(yè)的人才培養(yǎng)范式及主題演變網(wǎng)絡(luò)、大數(shù)據(jù)專業(yè)的課程層次、圖情檔學科主干知識及與大數(shù)據(jù)專業(yè)的聯(lián)系、面向圖情檔人才培養(yǎng)的數(shù)據(jù)科學類課程群建設(shè)思路以及具體的課程內(nèi)容,陳沫等[10]提出的課程體系分層和葉鷹[4]提出的圖情檔學科主干知識對本文具有重要的基礎(chǔ)和啟發(fā)作用。研究提到的基于數(shù)據(jù)科學建設(shè)圖情檔學科人才培養(yǎng)新模式是一種發(fā)展的路徑選擇,有高校已經(jīng)將數(shù)據(jù)科學作為圖情檔學科自設(shè)的二級學科。但圖情檔也有不少其他的特色方向,例如中國人民大學著力建設(shè)的“數(shù)字人文”,復(fù)旦大學積極推動的“古籍保護與非物質(zhì)文化遺產(chǎn)”及華東師范大學于2015年啟動的“商業(yè)分析”探索等。
無論發(fā)展模式如何抉擇,做到守正與創(chuàng)新都應(yīng)是改革的前提。大數(shù)據(jù)時代下,圖情檔學科人才培養(yǎng)改革發(fā)展剛剛起步,且面臨著諸多問題:如何將數(shù)據(jù)科學課程與本專業(yè)的學科特色深度結(jié)合?如何使圖情檔專業(yè)的人才培養(yǎng)模式與社會需求相結(jié)合?如何使圖情檔專業(yè)的人才培養(yǎng)模式向國際看齊,又不失中國特色?這些問題近年來已有諸多討論,但仍未有顯著共識。此外,方法層面,本研究應(yīng)用的時序主題網(wǎng)絡(luò)模型也存在局限性,后續(xù)研究可以考慮:①完善科學的切片范圍計算指標;②探索更合適的布局計算方法,以清晰、完整地呈現(xiàn)演變網(wǎng)絡(luò);③利用PCA降維等方法降低共現(xiàn)的稀疏性。
參考文獻:
[1]葉鷹,馬費成.數(shù)據(jù)科學興起及其與信息科學的關(guān)聯(lián)[J].情報學報,2015,34(6):575-580.
[2]孫建軍,李陽,裴雷.“數(shù)智”賦能時代圖情檔學科變革之思考[J].圖書情報知識,2020(3):22-27.
[3]趙星,喬利利,葉鷹.面向數(shù)據(jù)智能和知識發(fā)現(xiàn)的圖書情報學跨界拓展———數(shù)據(jù)-學術(shù)-創(chuàng)造整合論[J].中國圖書館學報,2020,46(6):16-25.
[4]葉鷹.試論圖書情報學的主干知識及有效方法:兼論雙證法和模本法之效用[J].中國圖書館學報,2021,47(3):58-66.
[5]閆慧,韓蕾倩,吳萌,等.圖書館學、情報學與檔案學2029年發(fā)展前景研究[J].圖書與情報,2019(6):2-17,153.
[6]初景利.“新文科”呼喚圖情檔成為“硬”學科[J].圖書與情報,2020(6):1-3.
[7]馬費成,李志元.新文科背景下我國圖書情報學科的發(fā)展前景[J].中國圖書館學報,2020,46(6):4-15.
[8]張久珍.圖情檔學科建設(shè)需要與新時代發(fā)展接軌[J].圖書與情報,2020(6):17-18.
作者:楊杰1趙星1,2
轉(zhuǎn)載請注明來自發(fā)表學術(shù)論文網(wǎng):http:///jjlw/29590.html