本文摘要:[摘要]目的利用文獻(xiàn)計量學(xué)研究方法,解析數(shù)字PCR技術(shù)相關(guān)文獻(xiàn)的分布模式和知識結(jié)構(gòu)。方法應(yīng)用網(wǎng)絡(luò)數(shù)據(jù)庫檢索2000年1月1日至2019年12月31日已發(fā)表的有關(guān)數(shù)字PCR的學(xué)術(shù)論文。利用書目條目共現(xiàn)矩陣生成器(BICOMB),對提取的主題詞進(jìn)行定量分析。根據(jù)生成的高頻主要主題詞/
[摘要]目的利用文獻(xiàn)計量學(xué)研究方法,解析數(shù)字PCR技術(shù)相關(guān)文獻(xiàn)的分布模式和知識結(jié)構(gòu)。方法應(yīng)用網(wǎng)絡(luò)數(shù)據(jù)庫檢索2000年1月1日至2019年12月31日已發(fā)表的有關(guān)數(shù)字PCR的學(xué)術(shù)論文。利用書目條目共現(xiàn)矩陣生成器(BICOMB),對提取的主題詞進(jìn)行定量分析。根據(jù)生成的高頻主要主題詞/副主題詞詞篇矩陣,利用gCluto軟件進(jìn)行聚類分析。構(gòu)建主要主題詞/副主題詞的共現(xiàn)矩陣,進(jìn)行戰(zhàn)略坐標(biāo)及社會網(wǎng)絡(luò)關(guān)系分析。結(jié)果根據(jù)檢索策略,共納入2733篇論文,年度論文發(fā)表呈現(xiàn)顯著上升趨勢。在所提取的主題詞中,識別出25個高頻主題詞/副主題詞,并將熱點(diǎn)聚類為5類。在戰(zhàn)略坐標(biāo)圖中,數(shù)字PCR技術(shù)在肺癌突變基因快速檢測及原癌基因突變檢測方法的建立與臨床應(yīng)用方面的研究處于成熟且核心位置,而在婦科腫瘤檢測應(yīng)用、無創(chuàng)產(chǎn)前檢查以及液體活檢等方面處于相對不成熟階段,為日后的研究提供了潛在的研究空間。結(jié)論通過對近20年的數(shù)字PCR技術(shù)的文獻(xiàn)計量學(xué)研究,可以對這一技術(shù)的發(fā)展趨勢和相關(guān)應(yīng)用進(jìn)行總體把握,為研究人員的項目實際和運(yùn)行提供借鑒。
[關(guān)鍵詞]數(shù)字PCR;文獻(xiàn)計量學(xué);共詞分析;戰(zhàn)略坐標(biāo);社會關(guān)系網(wǎng)絡(luò)分析
數(shù)字PCR(digitalpolymerasechainreaction,dPCR)技術(shù)是20世紀(jì)90年代發(fā)展起來的新一代聚合酶鏈反應(yīng)擴(kuò)增技術(shù)[1]。經(jīng)過十幾年的不斷探索與應(yīng)用,數(shù)字PCR技術(shù)因其能實現(xiàn)對初始樣本的絕對定量、高靈敏性、高特異性和高精確度等特點(diǎn),廣泛應(yīng)用于基因檢測、疾病診斷、環(huán)境及食品監(jiān)測等方面。文獻(xiàn)計量學(xué)方法,如詞性分析和共詞分析等,可對文獻(xiàn)中熱點(diǎn)問題進(jìn)行定量分析與解讀[2]。
根據(jù)選定文獻(xiàn)可用一組專業(yè)詞匯來表示的原則,在分析過程中,兩個相關(guān)的專業(yè)詞匯之間的關(guān)系由它們在同一篇文獻(xiàn)中共存的頻率來定義[3]。然后,應(yīng)用聚類分析等統(tǒng)計分析方法對詞匯進(jìn)行分類,進(jìn)而分析出所選研究的重點(diǎn)和框架[4]。此外,根據(jù)共現(xiàn)聚類分析結(jié)果,可計算出每個聚類中關(guān)鍵詞的密度和向心度,繪制戰(zhàn)略坐標(biāo)圖,對所選研究領(lǐng)域的發(fā)展趨勢,潛在研究方向作出描述。社會網(wǎng)絡(luò)分析(socialnetworkanalysis,SNA)是研究一組因素之間的關(guān)系并分析其網(wǎng)絡(luò)聯(lián)系的方法,它包括節(jié)點(diǎn)(在本研究中表示提取的主要主題詞/副主題詞)和連線(在本研究中表示這些主題詞之間的關(guān)系)[5]。
在復(fù)雜網(wǎng)絡(luò)中,識別影響節(jié)點(diǎn)具有重要的理論和實踐意義。中心度是分析社會網(wǎng)絡(luò)的一種重要度量方法,其中點(diǎn)度中心度、中間中心度和接近中心度是比較網(wǎng)絡(luò)中節(jié)點(diǎn)中心性的3個被廣泛接受的指標(biāo)[6]。本研究結(jié)合文獻(xiàn)計量學(xué)、戰(zhàn)略坐標(biāo)分析和社會關(guān)系網(wǎng)絡(luò)分析的優(yōu)勢,就dPCR技術(shù)近20年的文獻(xiàn)報道情況及熱點(diǎn)研究領(lǐng)域進(jìn)行了分析。
1數(shù)據(jù)來源與方法
1.1數(shù)據(jù)來源
本研究以PubMed數(shù)據(jù)庫為基礎(chǔ),以((((((("digitalpolymerasechainreaction"Title/Abstract)OR("digitalPCR"Title/Abstract))OR("DPCR"Title/Abstract))OR("dropletdigitalpolymerasechainreaction"Title/Abstract))OR("dropletdigitalPCR"Title/Abstract))OR("ddpcr"Title/Abstract))OR("chipdigitalpolymerasechainreaction"Title/Abstract))OR("chipdigitalPCR"Title/Abstract)為檢索式,時間限定為2000年1月1日至2019年12月31日。從PubMed下載的每份文獻(xiàn)包含以下項目:標(biāo)題、作者、出版年份和主要主題詞/副主題詞。這些數(shù)據(jù)保存為TXT格式供后續(xù)分析。
1.2方法
1.2.1數(shù)據(jù)提取與矩陣設(shè)置
書目條目共現(xiàn)矩陣生成器(bibliographicitemco⁃occurrencematrixbuilder,BICOMB),可在數(shù)據(jù)庫中精準(zhǔn)提取和統(tǒng)計書目信息,生成詞篇矩陣及共現(xiàn)矩陣,為后續(xù)統(tǒng)計分析提供基礎(chǔ)數(shù)據(jù)[7]。
在本研究中,利用該軟件對收集文獻(xiàn)的年份、作者、主要主題詞/副主題詞等信息進(jìn)行頻率排序。H指數(shù)原則,即將需要詞條根據(jù)出現(xiàn)頻次升序排序,當(dāng)出現(xiàn)頻次與排序序號相一致時記為H指數(shù)[8]。在本研究中以dPCR為研究對象,提取的高頻主題詞中有“PolymeraseChainReaction”等主題詞掩蓋了檢索結(jié)果中真實應(yīng)用的其他主題詞,“DNA/*analysis”“DNA/*genetics”范圍過于寬泛,指向性較差。
因此,在統(tǒng)計時將這些主題詞剔除,重新得到高頻主題詞/副主題詞列表。根據(jù)高頻主題詞在同一篇文章共現(xiàn)情況,構(gòu)建以主要主題詞/副主題詞為行名、源文獻(xiàn)為列名的主題詞⁃源文獻(xiàn)詞篇矩陣,利用gCluto(graphicalCLUsteringtoolkit,devel⁃opedbyRasmussen,Newman,andKarypisfromUni⁃versityofMinnesota),Version1.0軟件建立雙聚類分析模型[7]。同時構(gòu)建高頻主題詞共現(xiàn)矩陣,進(jìn)行戰(zhàn)略坐標(biāo)分析及社會網(wǎng)絡(luò)分析。
1.2.2戰(zhàn)略坐標(biāo)分析
根據(jù)高頻主題詞共現(xiàn)情況計算出每個聚類類別的向心性和密度,繪制二維空間坐標(biāo)圖[9]。X軸代表向心性或外部銜接指數(shù),即主題詞在整個網(wǎng)絡(luò)中的核心位置。Y軸代表密度或 內(nèi)部凝聚力指數(shù),即主題詞在整個網(wǎng)絡(luò)中的發(fā)展情況[10]。在X軸和Y軸上生成4個象限,根據(jù)各個聚類類別在象限中的位置,描述聚類類別在該領(lǐng)域的核心位置及發(fā)展情況。
1.2.3社會關(guān)系網(wǎng)絡(luò)分析
將高頻主題詞共現(xiàn)矩陣導(dǎo)入Ucinet6.0(UniversityofCalifornia,Irvine,USA)軟件,采用社會網(wǎng)絡(luò)分析方法對dPCR的主題詞和知識結(jié)構(gòu)進(jìn)行分析[11]。
利用NetDraw2.084軟件將主題詞進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)可視化處理,使其顯示在二維圖上。網(wǎng)絡(luò)節(jié)點(diǎn)是主要主題詞/副主題詞標(biāo)簽,連線表示這些詞的共現(xiàn)頻率。為了解dPCR主題詞的網(wǎng)絡(luò)結(jié)構(gòu),我們通過測量每個節(jié)點(diǎn)的點(diǎn)度中心度、中間中心度和接近中心度來評估這些關(guān)鍵詞在網(wǎng)絡(luò)中的位置。點(diǎn)度中心度表示網(wǎng)絡(luò)圖的整體中心性,體現(xiàn)整體網(wǎng)的集中程度。中間中心度表示該點(diǎn)的“中間人”程度,即媒介程度。接近中心度被定義為一個節(jié)點(diǎn)到所有其他節(jié)點(diǎn)的最短距離的和,意味著接近中心度越高,該節(jié)點(diǎn)與其他節(jié)點(diǎn)的距離就越近。
2結(jié)果
2.1文獻(xiàn)基本情況
根據(jù)檢索策略,本研究共納入2733篇文獻(xiàn)。自2012年開始,關(guān)于dPCR技術(shù)的報道呈顯著上升趨勢。本研究中共有918種期刊報道過dPCR技術(shù)相關(guān)文獻(xiàn),其中發(fā)表量前十的期刊中,前3位期刊PLoSOne、ScientificReports和MethodsinMo⁃lecularBiology發(fā)文數(shù)占該領(lǐng)域檢索文獻(xiàn)總數(shù)10.53%。
2.2研究熱點(diǎn)聚類及聚類分析
在檢索到的2733篇文獻(xiàn)中,累計出現(xiàn)主要主題詞/副主題詞3363個。主題詞出現(xiàn)頻次與排序相交處在24~25,取24為本研究的H指數(shù),進(jìn)而定義出現(xiàn)頻次≥24次的主題詞為高頻主題詞。根據(jù)H指數(shù)原則提取出25個高頻主題詞。
25個高頻主題詞出現(xiàn)頻次的累計百分比為15.47%。這些詞可代表近20年dPCR領(lǐng)域的研究熱點(diǎn)。在文獻(xiàn)篇名與主要主題詞/副主題詞雙聚類分析基礎(chǔ)上,對主題詞進(jìn)行分組,共得5個聚類分組。由聚類分組可視化圖形可見,5組區(qū)域相互獨(dú)立,其中類別1聚集性最好,表明類別1內(nèi)部主題詞與該研究領(lǐng)域具有很高的一致性。
2.3dPCR社會關(guān)系網(wǎng)絡(luò)分析
使用點(diǎn)度中心度、中間中心度和接近中心度對社會關(guān)系網(wǎng)絡(luò)圖進(jìn)行分析。在dPCR網(wǎng)絡(luò)中,有10個主要主題詞/副主題詞的點(diǎn)度中心度大于平均值50.96,同時包含了排名前10的高頻主題詞/副主題詞中的8個,在這8個高頻主題詞中“LungNeo⁃ plasms/*genetics”的點(diǎn)度中心度最高,為167。中間中心度前兩名分別為23.58、21.19,分別代表“Molec⁃ularDiagnosticTechniques/*methods”和“DNAMuta⁃tionalAnalysis/*methods”,這兩個主題詞在網(wǎng)絡(luò)中具有較強(qiáng)的中介作用。“DNAMutationalAnalysis/*methods”具有最高的接近中心度85.71。為便于理解,我們根據(jù)中間中心度繪制了社會關(guān)系網(wǎng)絡(luò)圖。
3討論
文獻(xiàn)計量學(xué)研究中,主要主題詞可揭示所在文獻(xiàn)中核心的內(nèi)容,大量主題詞集合可反映該學(xué)科的研究現(xiàn)狀和發(fā)展?fàn)顩r,目前該研究方法已廣泛用于病原微生物分析及軍事訓(xùn)練分析等多個領(lǐng)域[4,12]。為系統(tǒng)考察dPCR的基本知識結(jié)構(gòu),本研究在文獻(xiàn)計量學(xué)基礎(chǔ)上,將共詞分析,戰(zhàn)略坐標(biāo)以及社會關(guān)系網(wǎng)絡(luò)分析結(jié)合起來。根據(jù)共詞分析,將緊密度強(qiáng)的主題詞形成類別并分析。
3.1類別1:肺癌突變基因快速檢測方面的應(yīng)用肺癌是世界上新發(fā)病例和死亡人數(shù)最多的癌癥,非小細(xì)胞肺癌是最常見的亞型,約占所有病例的85%[13]。表皮生長因子受體(epithelialgrowthfactorreceptor,EGFR)、鼠類肉瘤病毒癌基因(kirstenratsarcomaviraloncogene,KRAS)等癌基因的某些突變與非小細(xì)胞肺癌治療藥物敏感性相關(guān),肺癌突變基因的全面分析對非小細(xì)胞肺癌患者提供最佳治療方案至關(guān)重要[14,15]。
目前,dPCR技術(shù)已證明在鑒定和定量腫瘤游離DNA突變方面具有極高的靈敏度和準(zhǔn)確性,特別是在藥物敏感或耐藥的腫瘤突 變基因評估中具有很高參考價值,為臨床診斷、治療方案優(yōu)化及預(yù)后評估提供了重要的檢測依據(jù)[16]。
3.2類別2:原癌基因突變檢測方法的建立與臨床應(yīng)用癌癥檢測,即對原癌基因和關(guān)鍵信號通路中的體細(xì)胞變異進(jìn)行篩選,對完善臨床診斷、藥物靶向治療提供幫助[17]。EGFR及其下游信號通路參與了包括結(jié)直腸癌在內(nèi)的多種人類腫瘤的發(fā)生和發(fā)展過程[18]。
目前應(yīng)用抗EGFR單抗[如帕尼曲單抗(pani⁃tumab)或西妥昔單抗(cetuximab)]可使患者取得一定的療效,但這種療效與患者EGFR基因突變與否密切相關(guān)[19]。因此,在治療前對患者進(jìn)行針對性的基因檢測,對其后續(xù)療效檢測及評估具有重要意義。類別1和類別2具有緊密相關(guān)性,位于戰(zhàn)略坐標(biāo)圖中第一象限,表明目前該方面研究在整體研究中處于核心且成熟的地位,是整個研究的熱點(diǎn)領(lǐng)域。
3.3類別3:液體活檢概念的提出及應(yīng)用癌癥基因變化分析是目前癌癥患者管理和治療決策的核心問題。然而,目前用于癌癥基因檢測的原料,如腫瘤部位穿刺活檢、手術(shù)切除腫瘤或者石蠟保存腫瘤樣本給檢測分析帶來一定的局限性[20]。液體活檢提供了檢測、分析和監(jiān)測各種體液(如血液或尿液)中癌癥成分的機(jī)會,而不是在腫瘤組織的碎片中[21]。液體活檢除可實現(xiàn)一種非侵入性或微創(chuàng)的樣本獲取方式外,更使得對腫瘤的連續(xù)監(jiān)測成為可能。近幾年,在dPCR技術(shù)和下一代測序技術(shù)大力發(fā)展背景下,液體活檢為臨床檢測作出的貢獻(xiàn)越來越大。
3.4類別4:無創(chuàng)產(chǎn)前檢查及分子診斷等方面的應(yīng)用傳統(tǒng)產(chǎn)前檢查方式,如絨毛取樣和羊膜穿刺都是侵入性的,存在流產(chǎn)風(fēng)險[22]。1997年,在母體循環(huán)血中鑒定出無細(xì)胞胎兒DNA(CffDNA),使得通過簡單的靜脈穿刺進(jìn)行非侵入性的產(chǎn)前診斷成為可能[23]。然而,CffDNA通常只占孕婦血漿總DNA的10%~20%,存在大量母體DNA背景的干擾,使這種無創(chuàng)檢測方法的發(fā)展受到很大限制[24]。dPCR技術(shù)在精準(zhǔn)檢測方面具有獨(dú)特優(yōu)勢。因其可在復(fù)雜背景信息中精確檢測到胎兒DNA,dPCR目前已在21三體綜合征、常染色體遺傳病以及性連鎖遺傳病檢測研究方面取得一定進(jìn)展,為以后臨床廣泛應(yīng)用打下了基礎(chǔ)[25]。類別3和類別4也有密切關(guān)聯(lián),處于戰(zhàn)略坐標(biāo)圖中的第3象限,表明該方面的研究處于整體研究的相對邊緣區(qū)域,具有較大的發(fā)展空間。
3.5類別5:婦科腫瘤檢查及監(jiān)測中的應(yīng)用美國癌癥協(xié)會報道,大多數(shù)婦科腫瘤患者通過手術(shù)和術(shù)后化療方式可得到治療,但在目前監(jiān)測技術(shù)下,有超過半數(shù)患者在18個月內(nèi)復(fù)發(fā),并最終導(dǎo)致死亡。因此,及時有效的術(shù)后監(jiān)測成為提高存活率的關(guān)鍵。循環(huán)中的無細(xì)胞DNA被認(rèn)為是從正常細(xì)胞和癌細(xì)胞中脫落或釋放,并將循環(huán)中的無細(xì)胞血漿腫瘤DNA稱為血漿腫瘤DNA(ptDNA)[26]。
最近有研究使用dPCR檢測轉(zhuǎn)移性乳腺癌患者的前瞻性研究,將ptDNA與循環(huán)腫瘤細(xì)胞和乳腺癌血清標(biāo)志物CA15⁃3進(jìn)行了比較,并表明ptDNA更準(zhǔn)確地反映了腫瘤負(fù)荷,動態(tài)監(jiān)測范圍更大,便于后續(xù)治療和疾病進(jìn)展監(jiān)控[27]。
社會關(guān)系網(wǎng)絡(luò)中顯示,前10名高頻主題詞中,有8個具有較高的點(diǎn)度中心度。根據(jù)點(diǎn)度中心度的定義,我們認(rèn)為高頻主題詞,如“LungNeoplasms/*genetics”,與其他成分具有最強(qiáng)的直接聯(lián)系,是整個研究領(lǐng)域的核心問題。就本研究選用的中間中心度而言,“MolecularDiagnosticTechniques/*meth⁃ods”和“DNAMutationalAnalysis/*methods”處于整個網(wǎng)絡(luò)的中樞位置,表明它們在控制其他成分的相互連接方面具有最大作用。“PrenatalDiagnosis/*methods”“ViralLoad/*methods”和“DNACopyNum⁃berVariations/*genetics”處于該網(wǎng)絡(luò)的邊緣,表明dPCR技術(shù)在產(chǎn)前檢查及病毒載量中的運(yùn)用是新興領(lǐng)域,具有巨大研究潛力。
本文所采用的雙聚類分析和戰(zhàn)略坐標(biāo)圖可分別用于展示特定的主題詞結(jié)構(gòu)和評估每個類別的成熟狀態(tài),但這兩種方法都不能解釋各個節(jié)點(diǎn)之間的相互聯(lián)系。社會關(guān)系網(wǎng)絡(luò)圖彌補(bǔ)了上述不足,描述了整個領(lǐng)域中節(jié)點(diǎn)之間的關(guān)系。本研究在對dPCR主要主題詞進(jìn)行共詞分析的基礎(chǔ)上,將戰(zhàn)略坐標(biāo)與社會關(guān)系網(wǎng)絡(luò)圖結(jié)合,描述了整個領(lǐng)域的中心研究以及新興領(lǐng)域,為研究者發(fā)展和使用這一新技術(shù)提供了幫助。
【參考文獻(xiàn)】
[1]VogelsteinB,KinzlerKW.DigitalPCR[J].ProcNatlAcadSciUSA,1999,96(16):9236-9241.
[2]YaoQ,ChenK,YaoL,etal.Scientometrictrendsandknowledgemapsofglobalhealthsystemsresearch[J].HealthResPolicySyst,2014,12:26.
[3]HongY,YaoQ,YangY,etal.Knowledgestructureandthemetrendsanalysisongeneralpractitionerresearch:aCo⁃wordper⁃spective[J].BMCFamPract,2016,17:10.
[4]郭棟,黎檀實,劉輝,等.基于文獻(xiàn)計量與共詞分析的我軍戰(zhàn)傷救治模擬訓(xùn)練現(xiàn)狀研究[J].軍事醫(yī)學(xué),2020,44(1):1-6.
[5]ZhangC,YuQ,F(xiàn)anQ,etal.Researchcollaborationinhealthmanagementresearchcommunities[J].BMCMedInformDecisMak,2013,13:52.
[6]PiraveenanM,ProkopenkoM,HossainL.Percolationcentrality:quantifyinggraph⁃theoreticimpactofnodesduringpercolationinnetworks[J].PLoSOne,2013,8(1):e53095.
作者:杜奕溥1,2,趙勇1,楊瑞馥1,宋亞軍1
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/29629.html