本文摘要:[摘要]目的了解某大學(xué)醫(yī)學(xué)院內(nèi)科學(xué)碩士研究生學(xué)位論文中統(tǒng)計(jì)學(xué)方法應(yīng)用和誤用情況及其變化趨勢(shì)。方法檢索萬方數(shù)據(jù)庫中某大學(xué)醫(yī)學(xué)院2014年和2019年內(nèi)科學(xué)碩士研究生學(xué)位論文177篇作為研究對(duì)象,逐篇評(píng)閱,收集其中統(tǒng)計(jì)學(xué)方法的應(yīng)用和誤用情況。結(jié)果在是否應(yīng)用
[摘要]目的了解某大學(xué)醫(yī)學(xué)院內(nèi)科學(xué)碩士研究生學(xué)位論文中統(tǒng)計(jì)學(xué)方法應(yīng)用和誤用情況及其變化趨勢(shì)。方法檢索萬方數(shù)據(jù)庫中某大學(xué)醫(yī)學(xué)院2014年和2019年內(nèi)科學(xué)碩士研究生學(xué)位論文177篇作為研究對(duì)象,逐篇評(píng)閱,收集其中統(tǒng)計(jì)學(xué)方法的應(yīng)用和誤用情況。結(jié)果在是否應(yīng)用統(tǒng)計(jì)推斷(包括兩兩比較)、統(tǒng)計(jì)推斷方法的種類及數(shù)量方面2019年與2014年差別無統(tǒng)計(jì)學(xué)意義。2019年統(tǒng)計(jì)方法應(yīng)用率的前5位為:t檢驗(yàn)和方差分析(并列)、列聯(lián)表分析(包括卡方檢驗(yàn)和Fisher確切概率法)、線性相關(guān)分析、非參數(shù)檢驗(yàn)和Logistic回歸等;2014年為:t檢驗(yàn)、方差分析、列聯(lián)表分析、線性相關(guān)分析和非參數(shù)檢驗(yàn)等。2019年計(jì)算OR值并給出CI的使用率高于2014年(χ2=7.251,P<0.05)。2019年與2014年統(tǒng)計(jì)表應(yīng)用率均高于90%,統(tǒng)計(jì)圖的應(yīng)用率均不及60%,SPSS統(tǒng)計(jì)軟件的應(yīng)用率較高(94.3%,86.7%),但差別均無統(tǒng)計(jì)學(xué)意義(χ2=0.003~2.932,P均>0.05)。2019年論文中有40.2%給出具體P值,高于2014年的24.4%(χ2=5.049,P<0.05)。統(tǒng)計(jì)學(xué)表達(dá)有誤的在2019年占36.8%(32/87),高于2014年的20.0%(18/90)(χ2=6.147,P<0.05)。2019年統(tǒng)計(jì)推斷方法的誤用率是58.6%(51/87),與2014年的61.1%(55/90)差別無統(tǒng)計(jì)學(xué)意義(χ2=0.114,P>0.05)。結(jié)論內(nèi)科學(xué)碩士研究生學(xué)位論文中統(tǒng)計(jì)學(xué)方法應(yīng)用率較高,但統(tǒng)計(jì)描述不規(guī)范、統(tǒng)計(jì)推斷方法誤用率高。
[關(guān)鍵詞]模型,統(tǒng)計(jì)學(xué);統(tǒng)計(jì)學(xué)(主題);學(xué)位論文(主題);內(nèi)科學(xué);研究報(bào)告
醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法作為醫(yī)學(xué)科研工作的一種基本工具,在生物醫(yī)學(xué)領(lǐng)域逐步得到廣泛應(yīng)用。但隨之而來的是在醫(yī)學(xué)論文中統(tǒng)計(jì)學(xué)的誤用現(xiàn)象也激增。胡良平等[1]認(rèn)為,一篇醫(yī)學(xué)研究型論文的質(zhì)量主要取決于專業(yè)、文字和統(tǒng)計(jì)學(xué)3個(gè)方面。雖然目前越來越多的作者已充分認(rèn)識(shí)到統(tǒng)計(jì)學(xué)在論文中的作用,但許多調(diào)查研究顯示,在醫(yī)學(xué)論文中仍存在不少統(tǒng)計(jì)方法使用錯(cuò)誤及表達(dá)不當(dāng)?shù)那闆r[2-5]。
在醫(yī)學(xué)論文中,統(tǒng)計(jì)學(xué)表述的重要性幾乎與專業(yè)表述齊同,論文中統(tǒng)計(jì)學(xué)表述的質(zhì)量會(huì)直接影響整個(gè)論文的質(zhì)量,錯(cuò)誤的統(tǒng)計(jì)學(xué)方法會(huì)導(dǎo)致錯(cuò)誤的結(jié)論。碩士研究生學(xué)位論文不僅是其取得學(xué)位的憑證,也反映出研究生的科研能力與學(xué)術(shù)水平。為提高醫(yī)學(xué)研究生學(xué)位論文的統(tǒng)計(jì)學(xué)方法的應(yīng)用水平和論文質(zhì)量、為實(shí)驗(yàn)的統(tǒng)計(jì)學(xué)設(shè)計(jì)及論文評(píng)審提供理論依據(jù),并為改善醫(yī)學(xué)碩士研究生的統(tǒng)計(jì)學(xué)教學(xué)質(zhì)量提供一些參考,本文選取某大學(xué)醫(yī)學(xué)院2014年和2019年共177篇內(nèi)科學(xué)碩士研究生的學(xué)位論文,調(diào)查和分析其統(tǒng)計(jì)學(xué)方法的應(yīng)用和誤用情況。
1材料和方法
1.1調(diào)查對(duì)象
檢索萬方數(shù)據(jù)庫,文獻(xiàn)類型選擇“學(xué)位論文”,作者單位選擇“某某大學(xué)”,發(fā)表時(shí)間選擇2014年和2019年,初步篩選出7200篇學(xué)位論文,其中2014年2934篇,2019年4266篇。然后,手工篩選出論文首頁“學(xué)科專業(yè)”為“內(nèi)科學(xué)”的碩士研究生學(xué)位論文177篇,其中2014年90篇,2019年87篇,涉及的具體專業(yè)包括消化系統(tǒng)疾病、血液系統(tǒng)疾病、腎臟系統(tǒng)疾病、風(fēng)濕病、呼吸系統(tǒng)疾病、內(nèi)分泌與代謝性疾病和心血管系統(tǒng)疾病等。調(diào)查論文中統(tǒng)計(jì)學(xué)應(yīng)用(是否應(yīng)用統(tǒng)計(jì)推斷、統(tǒng)計(jì)推斷方法的種類及數(shù)量、是否應(yīng)用統(tǒng)計(jì)圖表以及使用何種統(tǒng)計(jì)學(xué)軟件)和統(tǒng)計(jì)學(xué)誤用(統(tǒng)計(jì)表述不規(guī)范或不充分、統(tǒng)計(jì)推斷方法誤用或未用)情況。
1.2調(diào)查方法按是否應(yīng)用統(tǒng)計(jì)推斷將論文分為兩大類。若一篇文章中未應(yīng)用任何統(tǒng)計(jì)推斷(包括參數(shù)估計(jì)和假設(shè)檢驗(yàn))或僅對(duì)數(shù)據(jù)進(jìn)行描述,均歸類為無統(tǒng)計(jì)推斷。對(duì)于應(yīng)用統(tǒng)計(jì)推斷的論文,著重考察其是否明確指出所用的統(tǒng)計(jì)方法并做相應(yīng)記錄。若同一論文中應(yīng)用多種統(tǒng)計(jì)分析方法則分別記錄,一篇論文中重復(fù)應(yīng)用一種統(tǒng)計(jì)分析方法的僅記錄1次。對(duì)于無統(tǒng)計(jì)推斷的論文,考察其是否漏用統(tǒng)計(jì)推斷。結(jié)果描述方面,主要考察統(tǒng)計(jì)圖表的應(yīng)用比例和類型。在統(tǒng)計(jì)學(xué)誤用方面,分為統(tǒng)計(jì)描述有誤、統(tǒng)計(jì)推斷方法誤用、缺少必要統(tǒng)計(jì)推斷、僅給出P值而忽略推斷方法及統(tǒng)計(jì)量等4種情況。對(duì)文中所用統(tǒng)計(jì)軟件的種類和數(shù)量信息也進(jìn)行了收集。
1.3統(tǒng)計(jì)方法采用SPSS18.0統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)進(jìn)行分析。計(jì)數(shù)資料比較采用χ2檢驗(yàn);當(dāng)1
2結(jié) 果
2.1統(tǒng)計(jì)學(xué)方法應(yīng)用情況
2.1.1統(tǒng)計(jì)學(xué)方法應(yīng)用概述本次研究共收錄177篇內(nèi)科學(xué)碩士學(xué)位論文,2014年的90篇論文中有98.9%使用了統(tǒng)計(jì)推斷,其中24.4%的論文中給出了具體的P值;2019年的87篇論文中有96.6%應(yīng)用統(tǒng)計(jì)推斷,其中40.2%給出具體的P值。2019年的P值給出率明顯高于2014年,差異有統(tǒng)計(jì)學(xué)意義(χ2=5.049,P=0.025)。
2.1.2應(yīng)用統(tǒng)計(jì)方法的種類
本研究中2014年和2019年某醫(yī)學(xué)院內(nèi)科學(xué)碩士學(xué)位論文中統(tǒng)計(jì)方法應(yīng)用種類的比較見表1。2019年統(tǒng)計(jì)方法應(yīng)用率的前5位順序?yàn)椋簍檢驗(yàn)和方差分析(并列)、列聯(lián)表分析(包括卡方檢驗(yàn)和Fisher確切概率法)、線性相關(guān)分析、非參數(shù)檢驗(yàn)和Logistic回歸等;2014年為:t檢驗(yàn)、方差分析、列聯(lián)表分析、線性相關(guān)分析和非參數(shù)檢驗(yàn)等。其中2019年計(jì)算OR值并給出CI的使用率高于2014年(χ2=7.251,P<0.05)。
使用方差分析、R×C列聯(lián)表卡方檢驗(yàn)或多組比較秩和檢驗(yàn)后,若結(jié)論為差異有統(tǒng)計(jì)學(xué)意義則需做組間的兩兩比較,以明確是哪兩組間的差異有統(tǒng)計(jì)學(xué)意義。2019年有45.5%(30/66)的論文中正確運(yùn)用了兩兩比較方法,略高于2014年的40.98%(25/61),但差別沒有統(tǒng)計(jì)學(xué)意義(χ2=0.258,P>0.05)。在常用的幾種兩兩比較方法中,LSD檢驗(yàn)的使用率在2019年高于2014年(χ2=17.527,P<0.001),而SNK-q檢驗(yàn)的使用率2014年高于2019年(χ2=10.229,P=0.001)。
2.1.3統(tǒng)計(jì)學(xué)方法應(yīng)用數(shù)量在應(yīng)用統(tǒng)計(jì)方法數(shù)量的頻率分布上,2014年與2019年的差異沒有統(tǒng)計(jì)學(xué)意義(χ2=8.356,P>0.05)。2019年有19.5%(17/87)的論文使用了4種及4種以上的統(tǒng)計(jì)學(xué)方法,略高于2014年的10.0%(9/90),但二者差異也沒有統(tǒng)計(jì)學(xué)意義(χ2=2.580,P>0.05)。
2.1.4統(tǒng)計(jì)圖、統(tǒng)計(jì)表和統(tǒng)計(jì)軟件應(yīng)用2019年內(nèi)統(tǒng)計(jì)方法應(yīng)用種類比較(篇(χ/%))?茖W(xué)碩士研究生學(xué)位論文中統(tǒng)計(jì)表為94.3%(82/87)和統(tǒng)計(jì)圖為49.4%(43/87)的應(yīng)用率均略低于2014年的95.6%(86/90)和56.7%(51/90),但二者間差異無統(tǒng)計(jì)學(xué)意義(χ2=0.003、0.931,P>0.05)。
統(tǒng)計(jì)表的應(yīng)用較之統(tǒng)計(jì)圖普遍,且應(yīng)用率最高的分 別為復(fù)合表、直條圖或誤差條圖、散點(diǎn)圖和線圖等。2019年內(nèi)科學(xué)碩士學(xué)位論文中有94.3%(82/87)使用SPSS統(tǒng)計(jì)軟件處理數(shù)據(jù),高于2014年的86.7%(78/90),但兩者差異沒有統(tǒng)計(jì)學(xué)意義(χ2=2.932,P>0.05)。SPSS是內(nèi)科學(xué)碩士研究生最常用的統(tǒng)計(jì)軟件。
2.2統(tǒng)計(jì)學(xué)方法誤用情況的比較
2.2.1統(tǒng)計(jì)學(xué)表達(dá)不規(guī)范或不充分
本次研究的論文中若出現(xiàn)給出P值但統(tǒng)計(jì)方法交代不清、統(tǒng)計(jì)學(xué)表達(dá)不規(guī)范、統(tǒng)計(jì)推斷過程不完整就得出結(jié)論等情況均視為統(tǒng)計(jì)表達(dá)有誤,其中統(tǒng)計(jì)學(xué)表達(dá)有誤的在2019年占36.8%(32/87),高于2014年的20.0%(18/90)(χ2=6.147,P<0.05)。給出P值但統(tǒng)計(jì)方法交代不清的,2019年有8篇,2014年有9篇,二者比較差異沒有統(tǒng)計(jì)學(xué)意義(χ2=0.033,P>0.05)。
2019年學(xué)位論文中統(tǒng)計(jì)推斷過程不完整的有9篇(10.3%),略低于2014年的11篇(12.2%),但二者比較差異無統(tǒng)計(jì)學(xué)意義(χ2=0.156,P>0.05)。
2.2.2統(tǒng)計(jì)推斷方法的誤用統(tǒng)計(jì)推斷方法的誤用率2019年是58.6%(51/87),2014年是61.1%(55/90),二者差異沒有統(tǒng)計(jì)學(xué)意義(χ2=0.114,P>0.05),尚不能認(rèn)為統(tǒng)計(jì)推斷方法的誤用狀況有所改善。
3討 論
本次調(diào)查顯示,2019年與2014年比較,該醫(yī)學(xué) 院內(nèi)科學(xué)碩士研究生學(xué)位論文中統(tǒng)計(jì)分析的應(yīng)用率均很高,統(tǒng)計(jì)描述誤用情況有所好轉(zhuǎn),但統(tǒng)計(jì)推斷誤用情況則無明顯的提高。2019年的統(tǒng)計(jì)分析方法應(yīng)用率前3位為兩均數(shù)比較、方差分析和列聯(lián)表分析,與國(guó)內(nèi)研究基本相同[6-8],但相對(duì)于國(guó)外文獻(xiàn)(前5位為:方差分析、多重比較、非參數(shù)檢驗(yàn)、t檢驗(yàn)和相關(guān)與回歸)來說設(shè)計(jì)較簡(jiǎn)單[9]。
統(tǒng)計(jì)學(xué)應(yīng)用方面主要有如下3點(diǎn)不足。①實(shí)驗(yàn)設(shè)計(jì)類型較簡(jiǎn)單,以單因素2水平和多水平為主,但假設(shè)檢驗(yàn)方法誤用率高,遠(yuǎn)高于張功員等[8]的結(jié)果。而且應(yīng)用如隨機(jī)區(qū)組設(shè)計(jì)、重復(fù)測(cè)量設(shè)計(jì)、析因設(shè)計(jì)等可以提高實(shí)驗(yàn)效率的設(shè)計(jì)類型的論文數(shù)量較少且統(tǒng)計(jì)誤用率很高。②統(tǒng)計(jì)方法應(yīng)用種類偏少。多種統(tǒng)計(jì)學(xué)方法的應(yīng)用可以更充分地利用數(shù)據(jù)信息,分析透徹,但同時(shí)也要注意統(tǒng)計(jì)方法濫用問題[10]。③統(tǒng)計(jì)軟件應(yīng)用較單一,2019年SPSS的應(yīng)用率高達(dá)94.3%(82/87),遠(yuǎn)高于劉智勇等[6]的研究。
SPSS雖是專業(yè)統(tǒng)計(jì)分析軟件,但因其操作簡(jiǎn)便而被廣泛應(yīng)用,同時(shí)因缺乏對(duì)不同統(tǒng)計(jì)方法適用性的認(rèn)識(shí)、不能充分正確地解釋研究結(jié)果及軟件本身缺少?gòu)?fù)雜分析選項(xiàng)等而被誤用[11],因此,沒有專業(yè)的統(tǒng)計(jì)學(xué)知識(shí)或經(jīng)過嚴(yán)格培訓(xùn)很難充分發(fā)揮其作用。非統(tǒng)計(jì)專業(yè)的醫(yī)學(xué)研究者更適于使用PPMS(PracticalPackageforMe-dicalStatistics)這種運(yùn)行穩(wěn)定、功能和應(yīng)用也較為簡(jiǎn)單便捷的統(tǒng)計(jì)軟件[12]。
此外,如果研究中有統(tǒng)計(jì)學(xué)家的參與可以確保結(jié)果全面、科學(xué)、可靠。因此,在內(nèi)科學(xué)碩士研究生的統(tǒng)計(jì)學(xué)教學(xué)中不僅應(yīng)當(dāng)把實(shí)驗(yàn)設(shè)計(jì)作為一個(gè)教學(xué)重點(diǎn),并與實(shí)際的課題設(shè)計(jì)案例相結(jié)合來鞏固教學(xué)效果,還要特別注重較復(fù)雜類 型(實(shí)驗(yàn)效率亦較高)統(tǒng)計(jì)方法的講解及相應(yīng)統(tǒng)計(jì)軟件正確合理的應(yīng)用,使研究生切實(shí)提高科研能力和課題完成效率。從上世紀(jì)60年代起,國(guó)外就對(duì)論文中統(tǒng)計(jì)方法應(yīng)用狀況進(jìn)行研究,發(fā)現(xiàn)存在統(tǒng)計(jì)學(xué)誤用問題的文章最高,占了60%以上[13]。而后國(guó)內(nèi)相繼也有研究表明,醫(yī)學(xué)論文中統(tǒng)計(jì)方法誤用現(xiàn)象普遍存在[14-16]。
統(tǒng)計(jì)學(xué)評(píng)職知識(shí): 可以發(fā)表統(tǒng)計(jì)學(xué)論文的期刊有哪些
王倩等[14]針對(duì)5種中華系列雜志論著文章中的統(tǒng)計(jì)學(xué)方法應(yīng)用狀況的研究結(jié)果顯示,存在統(tǒng)計(jì)學(xué)錯(cuò)誤的文章在1985年占24%,而1995年占36%;胡良平等[15-16]認(rèn)為在醫(yī)學(xué)期刊論文中,從研究的統(tǒng)計(jì)學(xué)設(shè)計(jì)、數(shù)據(jù)的描述和統(tǒng)計(jì)分析到解釋相應(yīng)的統(tǒng)計(jì)分析結(jié)果等,在這幾個(gè)環(huán)節(jié)上出現(xiàn)錯(cuò)誤的概率平均為80%。綜上所述,醫(yī)學(xué)院內(nèi)科學(xué)碩士研究生學(xué)位論文中統(tǒng)計(jì)方法應(yīng)用率很高,統(tǒng)計(jì)描述誤用情況有所好轉(zhuǎn),但統(tǒng)計(jì)推斷誤用情況無明顯改善,應(yīng)引起學(xué)校、醫(yī)學(xué)統(tǒng)計(jì)學(xué)教師、研究生及其導(dǎo)師、審稿人、雜志編輯及期刊管理部門的高度重視。針對(duì)以上問題提出如下幾點(diǎn)建議。
①全面開設(shè)統(tǒng)計(jì)學(xué)課程,增加授課數(shù)量、時(shí)間、深度和廣度,規(guī)范研究的統(tǒng)計(jì)學(xué)設(shè)計(jì)。②合理選擇統(tǒng)計(jì)學(xué)方法,培養(yǎng)統(tǒng)計(jì)思維,理論聯(lián)系實(shí)際。③加強(qiáng)編輯審稿及統(tǒng)計(jì)學(xué)審稿,規(guī)范論文中統(tǒng)計(jì)描述不規(guī)范的問題并發(fā)現(xiàn)深層次的統(tǒng)計(jì)問題。在統(tǒng)計(jì)審稿時(shí)提供原數(shù)據(jù)庫,以便對(duì)數(shù)據(jù)進(jìn)行準(zhǔn)確而綜合地審查。學(xué)校若能夠?qū)Ρ拘5难芯可鷮W(xué)位論文定期進(jìn)行統(tǒng)計(jì)學(xué)評(píng)價(jià),定性、定量地評(píng)價(jià)統(tǒng)計(jì)學(xué)誤用的嚴(yán)重程度,可有效提高論文的統(tǒng)計(jì)學(xué)報(bào)告質(zhì)量。④研究者提高統(tǒng)計(jì)修養(yǎng)。醫(yī)學(xué)碩士研究生應(yīng)提高自身的統(tǒng)計(jì)應(yīng)用水平,充分認(rèn)識(shí)統(tǒng)計(jì)學(xué)錯(cuò)誤所帶來的嚴(yán)重后果,把握住統(tǒng)計(jì)學(xué)的實(shí)踐性特點(diǎn),結(jié)合統(tǒng)計(jì)理論與科研實(shí)踐,加強(qiáng)自身學(xué)習(xí),提高統(tǒng)計(jì)修養(yǎng)。
[參考文獻(xiàn)]
[1]胡良平,郭秀花,劉惠剛.醫(yī)學(xué)統(tǒng)計(jì)學(xué)是評(píng)價(jià)醫(yī)學(xué)科技論文質(zhì)量?jī)?yōu)劣的重要依據(jù)[J].中華口腔醫(yī)學(xué)雜志,2001,36(3):229-232.
[2]HOLMESTH.Tencategoriesofstatisticalerrors:aguideforresearchinendocrinologyandmetabolism[J].AmericanJour-nalofPhysiologyEndocrinologyandMetabolism,2004,286(4):E495-E501.
[3]李子建.醫(yī)學(xué)統(tǒng)計(jì)學(xué)典型錯(cuò)誤辨析及其輔助教學(xué)系統(tǒng)的實(shí)現(xiàn)[D].北京:中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院,2003.
[4]倪宗瓚.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京:高等教育出版社,2003:121-136.
[5]張策.醫(yī)學(xué)科研論文中統(tǒng)計(jì)建模誤區(qū)和一般策略[J].中華醫(yī)學(xué)科研管理雜志,2019,32(6):418-422.
[6]劉智勇,范杉,張雪飛,等.96篇碩士研究生學(xué)位論文統(tǒng)計(jì)方法應(yīng)用狀況的調(diào)查分析[J].中國(guó)高等醫(yī)學(xué)教育,2002(6):16-17.
[7]高曉鳳,徐鵬,段云.2004—2014年某醫(yī)學(xué)院校本科生論文統(tǒng)計(jì)方法使用分析[J].中國(guó)高等醫(yī)學(xué)教育,2015(3):26-27.
作者:欒珊1,邵翠華2
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/27962.html