本文摘要:摘要:[研究目的]引文內(nèi)容分析是圖書情報(bào)學(xué)科經(jīng)典的定性研究方法,對(duì)引文內(nèi)容分析的研究與應(yīng)用現(xiàn)狀進(jìn)行梳理與總結(jié),為未來的研究提供參考。[研究方法]在Scopus數(shù)據(jù)庫中,以citationcontentanalysis、contentbasedcitationanalysis、contentcitationanalysis、in-textcitati
摘要:[研究目的]引文內(nèi)容分析是圖書情報(bào)學(xué)科經(jīng)典的定性研究方法,對(duì)引文內(nèi)容分析的研究與應(yīng)用現(xiàn)狀進(jìn)行梳理與總結(jié),為未來的研究提供參考。[研究方法]在Scopus數(shù)據(jù)庫中,以citationcontentanalysis、contentbasedcitationanalysis、contentcitationanalysis、in-textcitationanalysis等關(guān)鍵詞進(jìn)行檢索,在CNKI數(shù)據(jù)庫中以引文內(nèi)容分析、引文語境分析、文內(nèi)引文分析等關(guān)鍵詞檢索,采用人工篩選的方式獲得文獻(xiàn)87篇文獻(xiàn),從引文文內(nèi)特征、引文語義關(guān)系、引文內(nèi)容本體、應(yīng)用和研究框架等5個(gè)方面對(duì)當(dāng)前研究進(jìn)行了總結(jié)和評(píng)述。[研究結(jié)論]引文內(nèi)容分析能夠揭示引文之間深層次的語義關(guān)系,并作出客觀、科學(xué)的學(xué)術(shù)評(píng)價(jià)結(jié)論,但引文關(guān)系非常復(fù)雜,涉及引用目的、引用動(dòng)機(jī)、引用情感、引用功能等多個(gè)因素。對(duì)于引文間語義關(guān)系的研究,在生物醫(yī)學(xué)領(lǐng)域缺乏具有統(tǒng)一的規(guī)范化的界定和框架。從應(yīng)用角度來看,利用自然語言處理和深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)自動(dòng)引文情感分類,以識(shí)別出具有可重復(fù)價(jià)值的臨床研究文獻(xiàn)進(jìn)行推薦,區(qū)分出不可重復(fù)的臨床實(shí)驗(yàn),從而避免醫(yī)學(xué)資源浪費(fèi)是非常有意義的;谥R(shí)實(shí)體的引文內(nèi)容分析給學(xué)術(shù)評(píng)價(jià)和科研管理帶來了新的活力,將知識(shí)圖譜和引文內(nèi)容分析的有機(jī)結(jié)合能夠?qū)崿F(xiàn)智能化知識(shí)發(fā)現(xiàn),是值得進(jìn)一步探索的方向。
關(guān)鍵詞:引文內(nèi)容分析;引文語義關(guān)系;引文內(nèi)容本體;引文分類;學(xué)術(shù)評(píng)價(jià)
在科學(xué)研究評(píng)價(jià)中,引文分析是最為重要的一種評(píng)價(jià)方法,在期刊評(píng)價(jià)、世界高校排名中引文數(shù)據(jù)都是重要的參考依據(jù)。在文獻(xiàn)計(jì)量分析中,對(duì)研究論文影響力的測(cè)度通常是通過引文進(jìn)行的,例如文獻(xiàn)被引頻次、期刊影響因子[1]、H指數(shù)[2]、g指數(shù)[3]等定量計(jì)算方法。
引文分析方向投稿知識(shí): 引用率高的論文水平就高嗎
傳統(tǒng)的引文分析方法,只能揭示兩篇文獻(xiàn)之間的引用和被引關(guān)系,所有引文均等同視之,沒有根據(jù)引文的重要性進(jìn)行區(qū)分,不能說明被引文獻(xiàn)對(duì)于施引文獻(xiàn)的具體作用和價(jià)值,也沒有考慮到作者在引文文獻(xiàn)時(shí)的情感態(tài)度,這種評(píng)價(jià)難以真實(shí)反應(yīng)被引文獻(xiàn)的內(nèi)容和質(zhì)量水平。Metron曾提出引文規(guī)范性理論[4],他認(rèn)為引文是用于償還智力債務(wù)的一種形式,是對(duì)前人智力成果的褒獎(jiǎng)或信譽(yù)加分,然而隨后有研究發(fā)現(xiàn),存在大量的引文行為并沒有遵循這種規(guī)范,其意圖甚至與之相悖[5],Gilbert也質(zhì)疑莫頓的規(guī)范性假說過于理想化,他認(rèn)為作者引用某篇權(quán)威文獻(xiàn)是為了支持自己的觀點(diǎn)和結(jié)論[6]。
其實(shí)作者在引用文獻(xiàn)時(shí)經(jīng)歷了一個(gè)復(fù)雜的過程,涉及到引用動(dòng)機(jī)、引用目的和引用情感等多個(gè)方面[7],作者往往有多種理由去引用文獻(xiàn),而不同引文在學(xué)術(shù)交流的過程中也會(huì)發(fā)揮不同的功能。引用行為讓施引文獻(xiàn)和被引文獻(xiàn)之間產(chǎn)生了緊密的聯(lián)系,但這種關(guān)系不僅限于引用和被引,還存在更加復(fù)雜的語義關(guān)聯(lián),例如Catalini等[8]利用自然語義處理技術(shù)對(duì)JournalofImmunology期刊中的負(fù)面引文進(jìn)行實(shí)證研究,發(fā)現(xiàn)了負(fù)面引用與高質(zhì)量論文之間存在聯(lián)系。
隨著對(duì)引文內(nèi)容分析研究的深入,研究者正在積極探索將引文內(nèi)容在學(xué)術(shù)評(píng)價(jià)中的作用。引文內(nèi)容分析能夠深入的挖掘施引文獻(xiàn)和被引文獻(xiàn)之間的語義關(guān)聯(lián),因?yàn)橐奈谋臼亲髡咴谝梦墨I(xiàn)時(shí)做出的評(píng)價(jià)和解釋,承載了作者引用該文獻(xiàn)的目的和情感偏向,通過對(duì)引用語境或引用內(nèi)容進(jìn)行分類分析能夠揭示文獻(xiàn)引用的深層次語義內(nèi)涵,從而更好地對(duì)論文質(zhì)量進(jìn)行評(píng)價(jià)。引文分析是圖書情報(bào)學(xué)科的經(jīng)典研究方法之一,因此本文對(duì)已有的基于內(nèi)容的引文分析研究進(jìn)行梳理總結(jié),重點(diǎn)介紹目前引文內(nèi)容分析領(lǐng)域的研究進(jìn)展和研究框架,追蹤新的研究熱點(diǎn),并分析其存在的問題,以期為學(xué)術(shù)評(píng)價(jià)和知識(shí)關(guān)聯(lián)領(lǐng)域提供新的視角。
1數(shù)據(jù)收集
我們?cè)赟copus數(shù)據(jù)庫中利用“題名-摘要-關(guān)鍵詞冶途徑進(jìn)行文獻(xiàn)檢索,采用的檢索式如下:TITLEABS-KEY(“citationcontentanalysis冶)ORTITLE-ABS-KEY(“contentbasedcitationanalysis冶)ORTI鄄TLE-ABS-KEY(“contentcitationanalysis冶)ORTI鄄TLE-ABS-KEY(“in-textcitationanalysis冶)ORTI鄄TLE-ABS-KEY(“citationrelation冶),不限定年代,共獲得文獻(xiàn)205篇。
在CNKI數(shù)據(jù)庫中利用“篇關(guān)摘冶途徑進(jìn)行檢索,檢索式如下:TKA=引文內(nèi)容分析ORTKA=引文語境分析ORTKA=引文上下文分析ORTKA=文內(nèi)引文分析ORTKA=引文語義關(guān)系ORTKA=引文分類ORTKA=引文本體,不限定年代,共獲得文獻(xiàn)50篇。然后通過人工閱讀題名和摘要,排除引文網(wǎng)絡(luò)分析、文獻(xiàn)計(jì)量分析等具體應(yīng)用案例文獻(xiàn),最終獲得87文獻(xiàn)供進(jìn)一步分析。
2傳統(tǒng)的引文分析
科學(xué)是一個(gè)包含研究者、項(xiàng)目和成果的巨大網(wǎng)絡(luò),而引文則是將這些節(jié)點(diǎn)聯(lián)系起來的連線。為了及時(shí)追蹤科學(xué)前沿,了解文獻(xiàn)及科學(xué)發(fā)展動(dòng)態(tài),1955年,Eu鄄geneGarfield提出了科學(xué)引文索引(CitationIndexesforScience)[9],隨后在1963年開始編制和出版科學(xué)引文索引,該索引建立之初是用于檢索和追蹤科學(xué)文獻(xiàn)信息,但隨后發(fā)現(xiàn)引文數(shù)據(jù)對(duì)于文獻(xiàn)和期刊層面的評(píng)價(jià)起到了重要的促進(jìn)作用,因此有學(xué)者利用文獻(xiàn)獲得的引用次數(shù)來評(píng)價(jià)該文獻(xiàn)的影響力和質(zhì)量,利用學(xué)術(shù)期刊的影響因子來評(píng)價(jià)期刊的重要性。隨著WebofScience、PubMed、Scopus、GoogleScholar、MicrosoftAcademic等電子文獻(xiàn)數(shù)據(jù)庫的出現(xiàn),文獻(xiàn)的引用和傳播路徑得到了極大的擴(kuò)展。
對(duì)于個(gè)人研究者而言,利用引文分析可以發(fā)現(xiàn)更多的相關(guān)文獻(xiàn),提高檢索效率。而對(duì)于學(xué)科層面,利用引文分析能夠?qū)茖W(xué)活動(dòng)和行為進(jìn)行評(píng)價(jià)。近些年,替代計(jì)量學(xué)的出現(xiàn)為彌補(bǔ)了傳統(tǒng)文獻(xiàn)計(jì)量的不足,為引文分析提供了更多的統(tǒng)計(jì)指標(biāo),例如讀者閱讀數(shù)量、微博評(píng)論數(shù)量等。引文分析在科學(xué)地圖繪制、識(shí)別研究前沿和熱點(diǎn)、學(xué)術(shù)評(píng)價(jià)、影響因子、論文質(zhì)量評(píng)價(jià)等領(lǐng)域取得了重要的理論和實(shí)踐成果,但傳統(tǒng)的引文分析大多依賴于引文數(shù)據(jù)庫的構(gòu)建,這種模式存在諸多問題:(1)將所有引用等同視之;(2)僅考慮引文頻次或參考文獻(xiàn)數(shù)量;(3)難以揭示施引文獻(xiàn)和被引文獻(xiàn)之間的深層次的語義關(guān)系。
3引文文內(nèi)特征研究
傳統(tǒng)的引文分析從數(shù)量上考察引文的影響力,并不把引文文本信息作為研究對(duì)象,而引文文本分析則同時(shí)考慮定性和定量因素[10]。
引文文本一般是指引文標(biāo)識(shí)所在的句子或與其上下文句子的集合[11],它能提供施引文獻(xiàn)與被引文獻(xiàn)之間關(guān)系的重要信息。在引文文本分析中有兩個(gè)重要的相似概念:引用語境(cita鄄tioncontext)和引用內(nèi)容(citationcontent),根據(jù)Al鄄jaber[12]的觀點(diǎn),引用語境是指在施引文獻(xiàn)對(duì)被引文獻(xiàn)的描述性和評(píng)論性文字,而引用內(nèi)容則是指對(duì)被引文獻(xiàn)內(nèi)容的描述。ZhuXD[13]也曾提出,當(dāng)施引文獻(xiàn)中提及一篇參考文獻(xiàn)時(shí),出現(xiàn)在該文獻(xiàn)引文標(biāo)識(shí)附近的文本可當(dāng)作引用語境。
引文標(biāo)識(shí)是構(gòu)建引用內(nèi)容的基礎(chǔ),引文標(biāo)識(shí)周圍的詞語、語義內(nèi)容、甚至是隱含內(nèi)容都是引用內(nèi)容的一部分[14]。引用內(nèi)容分析和引用語境分析的目的也是不同的,前者是通過引文標(biāo)識(shí)周圍的語義含義了解和評(píng)價(jià)被引文獻(xiàn)的內(nèi)容特征,而后者旨在研究作者的引用過程,包括引用動(dòng)機(jī)和原因[15]。為了在評(píng)估學(xué)術(shù)成果時(shí)找到更加準(zhǔn)確的文獻(xiàn)計(jì)量學(xué)方法,越來越多的學(xué)者開始關(guān)注基于內(nèi)容的引文分析。從20世紀(jì)50年代開始,基于內(nèi)容的引文分析主要從引文窗、引文分布兩個(gè)方面開展。
3.1引文窗的研究
引文內(nèi)容包含了施引文獻(xiàn)和被引文獻(xiàn)之間關(guān)系的重要信息,關(guān)于引文內(nèi)容的范圍界定雖然沒有統(tǒng)一定論,但有很多學(xué)者提出了重要的觀點(diǎn)。2008年Ritchie[16]認(rèn)為位于引文標(biāo)識(shí)附近的詞語是能夠反映被引文獻(xiàn)內(nèi)容的,并定義了9種引文內(nèi)容,分別是淤不包含任何引用內(nèi)容,于僅包含施引句子,盂包含下一句引文之前的1個(gè)句子,榆包含施引句子以及該句子的前后兩句,虞包含下一句引文之前的3個(gè)句子,愚包含引文標(biāo)識(shí)左右共50個(gè)單詞,輿包含引文標(biāo)識(shí)左右共70個(gè)單詞,余包含引文標(biāo)識(shí)左右共100個(gè)單詞,俞包含完整的施引文獻(xiàn)。后來的研究者發(fā)現(xiàn)基于句子的方法比基于單詞數(shù)量的方法能更好地識(shí)別引文內(nèi)容。2012年,Athar[17]建議使用四句話作為合適的引文窗,即引用的句子、引用句子前面的1個(gè)句子、引用句子后面的2個(gè)句子。
較長的引用內(nèi)容包含了更多的描述性詞語,因此能夠更好地揭示被引文獻(xiàn)的內(nèi)容。很多學(xué)者也將四句話的引文窗作為引文內(nèi)容分析的金標(biāo)準(zhǔn)[18]。2017年,國內(nèi)學(xué)者章成志等[19]通過對(duì)Morgan&Calypool出版的39本學(xué)術(shù)專著的引文內(nèi)容進(jìn)行標(biāo)注,發(fā)現(xiàn)專著中引文及其上下文的平均長度(單詞數(shù))在20-30之間,與學(xué)術(shù)文獻(xiàn)的結(jié)果比較接近。隨著機(jī)器學(xué)習(xí)在文本分析中的應(yīng)用,引文內(nèi)容的自動(dòng)分析有了新的進(jìn)展,雷聲偉等[20]發(fā)現(xiàn)在進(jìn)行引文上下文識(shí)別任務(wù)中,用于文本分類的支持向量機(jī)(SupportVectorMachine,SVM)比序列標(biāo)注的條件隨機(jī)場(chǎng)(ConditionalRandomField,CRF)方法更加有效。
4引文的語義關(guān)系研究
引文內(nèi)容的語義關(guān)系分析主要在引用語境和引用內(nèi)容的分析的基礎(chǔ)上,從引文的動(dòng)機(jī)、引文的功能、引文的重要性三個(gè)方面開展。
4.1引用動(dòng)機(jī)研究
引文動(dòng)機(jī)是作者在引文文獻(xiàn)時(shí)的內(nèi)在心理活動(dòng),反應(yīng)了引用文獻(xiàn)的原因和目的,即為什么要引用文獻(xiàn)。有學(xué)者認(rèn)為引用文獻(xiàn)的主要?jiǎng)訖C(jī)是說服讀者[6],或者通過引用已有成果來增加說服力和提高權(quán)威性[27]。學(xué)者們希望通過分析和確定文獻(xiàn)被引用的具體原因,從而判斷作者的引用動(dòng)機(jī)和目的。
1964年,EugeneGarfield[28]列舉出了15項(xiàng)作者引用文獻(xiàn)的理由,但是他并沒有深入分析各項(xiàng)理由的出現(xiàn)頻率。該分類體系廣泛而抽象,適用于不同領(lǐng)域,但是分類目之間存在重疊性,如“向先驅(qū)者致敬冶和“確認(rèn)該出版物討論過某種理念或者概念冶,也沒有關(guān)于“使用前人研究數(shù)據(jù)、方法或成果冶的類目,但是該分類標(biāo)準(zhǔn)為后續(xù)研究奠定了基礎(chǔ)。
5引文內(nèi)容本體研究
5.1將引文作為實(shí)體類的本體
很多信息學(xué)相關(guān)的本體都將引文(citation)當(dāng)作一個(gè)重要的實(shí)體,通過在Ontobee數(shù)據(jù)庫檢索,發(fā)現(xiàn)有18個(gè)本體包含了cita鄄tion實(shí)體,并共用一個(gè)IRI(http://purl.obolibrary.org/obo/IAO_0000301)。在LinY等[53]發(fā)布的InformedConsentOntology本體中,實(shí)體citation的定義是“一種用于標(biāo)識(shí)特定出版物的文本實(shí)體冶,沒有下位實(shí)體,且通過對(duì)象屬性isabout與文檔實(shí)體(document)產(chǎn)生關(guān)聯(lián),同位類還有文檔題目(documenttitle)、表格(ta鄄ble)、書寫名字(writtenname)等,其父類為文本實(shí)體(textualentity)。
在SemanticscienceIntegratedOntolo鄄gy本體中,引文類的定義為一種文本實(shí)體,它表示在參考文數(shù)目或者參考文獻(xiàn)部分中描述的文獻(xiàn)來源。同樣沒有子類,其父類是文檔部分(documentcompo鄄nent)。還有一些本體考慮到了引文的特殊功能,例如在NCIThesaurusOBOEdition本體中,將引文說明(cita鄄tiondescription)定義為一種可接受格式的參考書目。
其子類包括臨床研究引文(ClinicalStudyCitation)、研究結(jié)果引用說明(ReferenceToStudyResultsCitationDescription)、研究參考引用說明(StudyReferenceCita鄄tionDescription)。而在Eagle-iresourceontology本體中,定義了引文管理對(duì)象(citationmanagementobjec鄄tive)和引文總頻次(globalcitationcount)兩個(gè)實(shí)體。此外,書目參考文獻(xiàn)本體(BibliographicReferenceOn鄄tology,BiRo)[54]能夠描述單個(gè)參考文獻(xiàn)以及它與被引文獻(xiàn)之間的關(guān)系,BiRo種定義了“isreferencedby冶和“reference冶兩個(gè)對(duì)象屬性,但是沒有涉及引用動(dòng)機(jī)或者理由。在以上本體的結(jié)構(gòu)中,雖然涉及到了引文實(shí)體,但是沒有進(jìn)一步深入引文本身,調(diào)研中我們還發(fā)現(xiàn)了部分本體的構(gòu)建中,考慮到引文間語義關(guān)系、引用行為或引用過程。
6引文內(nèi)容分析對(duì)臨床試驗(yàn)評(píng)價(jià)的意義
在生物醫(yī)學(xué)領(lǐng)域,引文內(nèi)容分析和情感分析對(duì)于臨床試驗(yàn)價(jià)值的判斷具有重要的意義?芍貜(fù)性和可預(yù)測(cè)性是科學(xué)研究的兩大特質(zhì),在過去的十年內(nèi),隨著學(xué)術(shù)文獻(xiàn)的爆發(fā)式增長,科學(xué)研究的可復(fù)現(xiàn)性成為了重要的議題,在很多醫(yī)學(xué)科學(xué)出版物發(fā)現(xiàn)存在大量不可重復(fù)的研究(Non-reproducibleStudy),美國生物醫(yī)藥巨頭安進(jìn)公司Amgen曾指出,在頂級(jí)腫瘤學(xué)期刊發(fā)表的論文中,有88%的研究結(jié)果是不可復(fù)現(xiàn)的[59],Io鄄annidis等人估計(jì)在生物醫(yī)學(xué)領(lǐng)域不可重復(fù)研究可能占到80%[60,61],而研究中出現(xiàn)的錯(cuò)誤、行為不當(dāng)或者欺詐是導(dǎo)致臨床試驗(yàn)結(jié)果不可再現(xiàn)的主要原因,目前有越來越多的研究論文由于實(shí)驗(yàn)不可重復(fù)性而被雜志撤回。
FavresseJ等[62]曾警示臨床醫(yī)生和醫(yī)學(xué)實(shí)驗(yàn)人員,參考這些不可重復(fù)的研究結(jié)果可能會(huì)誤導(dǎo)臨床決策。因此,盡可能早地發(fā)現(xiàn)和識(shí)別更多的可重復(fù)性低或者存在缺陷的論文,防止科研資源浪費(fèi)是非常重要的。引文文本中包含了作者引用該文獻(xiàn)的目的和情感偏向,因此科學(xué)研究的可重復(fù)性可以通過施引文本中的總體情感來評(píng)估和判斷,引用內(nèi)容和引用情感分析是評(píng)價(jià)臨床實(shí)驗(yàn)可重復(fù)性價(jià)值的重要步驟。
7引文內(nèi)容分析研究框架
從上述研究可以看出,隨著開放科學(xué)運(yùn)動(dòng)的興起以及自然語義處理技術(shù)的迅猛發(fā)展,引文內(nèi)容分析已從語法分析層面不斷地向語義分析層面深化。語法層面的引文內(nèi)容分析利用文獻(xiàn)的結(jié)構(gòu)和布局來確定引文的位置和數(shù)量,基于此對(duì)引文影響力進(jìn)行評(píng)估;而語義層面的引文內(nèi)容分析需要通過解析文本內(nèi)容制定分類框架,以此對(duì)引用行為進(jìn)行判定。根據(jù)已有的引文分析研究體系,并借鑒ZhangGuo[63]的理論框架,我們歸納出了引文內(nèi)容分析的研究框架。
語法層面的引文內(nèi)容分析通常關(guān)注單句引文,例如引文窗的研究涉及引文內(nèi)容和引文語境的界定、引文內(nèi)容的抽取,而在引文影響力的評(píng)估中,不同的引用方式反應(yīng)了作者對(duì)引用的重視程度,例如簡單提及、詳細(xì)解釋和直接引用這三種方式的引文重要性逐漸提高。但是引文內(nèi)容的語法分析往往并不涉及引文的具體內(nèi)容,難以挖掘深層次的語義關(guān)聯(lián)。事實(shí)上引用是一個(gè)由主觀因素觸發(fā)的內(nèi)在復(fù)雜行為,它是作者通過理性、權(quán)衡的形式做出的高性價(jià)比選擇。因此,通過預(yù)定義的引文分類體系,推斷出引用行為的動(dòng)機(jī)、目的、情感和功能是非常有意義的研究方向。隨著線性判別分析、主題模型、詞向量等技術(shù)的應(yīng)用,文獻(xiàn)之間的語義相關(guān)性判別變得更加高效,產(chǎn)生了引文推薦預(yù)測(cè)、自動(dòng)引文摘要等重要的研究方向。
8結(jié)語
本文對(duì)引文分析的發(fā)展歷程、引文文內(nèi)特征、引文語義關(guān)系和引文內(nèi)容本體的研究進(jìn)行了梳理總結(jié)。此外,還提出了引文內(nèi)容分析的研究框架。傳統(tǒng)的引文內(nèi)容分析方法將所有引文等同視之,難以揭示引文之間的深層次語義關(guān)系并作出客觀、科學(xué)的學(xué)術(shù)評(píng)價(jià)結(jié)論,在二十世紀(jì)中葉,得益于數(shù)據(jù)挖掘和自然語言處理算法的進(jìn)步,引文內(nèi)容分析逐步從人工化、小規(guī)模、少樣本的模式向半自動(dòng)化、大規(guī)模、海量樣本的模式蛻變。而引文關(guān)系非常復(fù)雜,涉及引用目的、引用動(dòng)機(jī)、引用情感、引用功能等多個(gè)因素,不同學(xué)科間存在差異性,單一體系很難詳盡闡釋引文關(guān)系的內(nèi)涵,隨著新媒體時(shí)代的發(fā)展,引文語義關(guān)系呈現(xiàn)出演進(jìn)與變化趨勢(shì)。
對(duì)于引文間語義關(guān)系的研究,目前學(xué)界缺少系統(tǒng)性描述和定義,尤其是生物醫(yī)學(xué)領(lǐng)域,雖然有從修辭角度研究引用關(guān)系的,但尚無引文語義關(guān)系與文本分類相關(guān)本體,缺乏具有統(tǒng)一的規(guī)范化的界定和框架。從應(yīng)用角度來看,引文內(nèi)容分析以及廣泛應(yīng)用于科研行為評(píng)價(jià)、科研數(shù)據(jù)管理、信息檢索、自動(dòng)摘要、引文推薦和預(yù)測(cè)、學(xué)術(shù)傳播和知識(shí)挖掘等研究方向。
具體來說,在臨床醫(yī)學(xué)領(lǐng)域,利用自然語言處理和深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)自動(dòng)引文情感分類,以識(shí)別出具有可重復(fù)價(jià)值的臨床研究文獻(xiàn)進(jìn)行推薦,區(qū)分出不可重復(fù)的臨床實(shí)驗(yàn),從而避免醫(yī)學(xué)資源浪費(fèi)是非常有意義;此外,文獻(xiàn)是知識(shí)的載體,在學(xué)術(shù)評(píng)價(jià)和管理過程中,應(yīng)該將評(píng)價(jià)對(duì)象進(jìn)一步細(xì)粒度化為文獻(xiàn)中包含的知識(shí)實(shí)體,這些實(shí)體包括但不局限于數(shù)據(jù)集、知識(shí)元、方法、工具和理論等,因?yàn)檫@些知識(shí)實(shí)體是引文內(nèi)容中的核心,是作者具體的引用對(duì)象。
可以預(yù)見,基于知識(shí)實(shí)體的引文內(nèi)容分析和計(jì)量分析將賦予文獻(xiàn)計(jì)量分析范式轉(zhuǎn)移的巨大勢(shì)能,而EugeneGarfield的引文索引網(wǎng)絡(luò)可以進(jìn)一步演化為知識(shí)實(shí)體引用關(guān)系網(wǎng)絡(luò),對(duì)于開展學(xué)術(shù)史研究的人員,能夠更細(xì)粒度地梳理學(xué)科發(fā)展歷程中的知識(shí)流動(dòng)和演進(jìn);2012年Google提出知識(shí)圖譜這一新的知識(shí)表示模式,產(chǎn)生了大量的概念驅(qū)動(dòng)或?qū)嶓w驅(qū)動(dòng)的圖譜,而數(shù)據(jù)集、視頻、網(wǎng)頁、博客等非著作型的引文內(nèi)容由于具有數(shù)字資源可定位性、唯一性,更加適合利用知識(shí)圖譜的方式進(jìn)行引文內(nèi)容分析,如何更好地將這些實(shí)體引文圖譜與其他開放資源產(chǎn)生關(guān)聯(lián),并實(shí)現(xiàn)智能化知識(shí)發(fā)現(xiàn)是未來值得進(jìn)一步探索的方向。
參考文獻(xiàn)
[1]GarfieldE.Citationanalysisasatoolinjournalevaluation[J].Science,1972,178(4060):471-479.
[2]HirschJE.Anindextoquantifyanindividual'sscientificre鄄searchoutput[J].ProceedingsoftheNationalAcademyofSci鄄encesoftheUnitedStatesofAmerica(PNAS),2005,102(46):16569-16572.
[3]EggheL.Theoryandpractiseoftheg-index[J].Scientometrics,2006,69(1):131-152.
[4]MetronR.TheSociologyofScience:TheoreticalandEmpiricalInvestigations[M].UniversityofChicagoPress,1973.
[5]GerasA,SiudemG,GagolewskiM.Shouldweintroduceadis鄄likebuttonforacademicarticles?[J].JournaloftheAssociationforInformationScienceandTechnology,2020,71(2):221-229.
[6]GilbertGN.ReferencingasPersuasion[J].SocialStudiesofSci鄄ence,1977,7(1):113-122.
作者:周志超
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///wslw/28821.html