本文摘要:本篇文章是由《 中國(guó)藥事 》發(fā)表一篇醫(yī)學(xué)論文,在藥學(xué)領(lǐng)域具有廣泛而深遠(yuǎn)的影響。特別是在藥監(jiān)藥檢系統(tǒng)更是具有其它期刊不可比擬的作用。是全國(guó)藥品監(jiān)督和藥品檢驗(yàn)系統(tǒng)唯一的國(guó)家級(jí)刊物。是我國(guó)藥品監(jiān)督管理干部、藥品檢驗(yàn)和藥學(xué)科技人員進(jìn)行藥學(xué)理論研究和
本篇文章是由《中國(guó)藥事》發(fā)表一篇醫(yī)學(xué)論文,在藥學(xué)領(lǐng)域具有廣泛而深遠(yuǎn)的影響。特別是在藥監(jiān)藥檢系統(tǒng)更是具有其它期刊不可比擬的作用。是全國(guó)藥品監(jiān)督和藥品檢驗(yàn)系統(tǒng)唯一的國(guó)家級(jí)刊物。是我國(guó)藥品監(jiān)督管理干部、藥品檢驗(yàn)和藥學(xué)科技人員進(jìn)行藥學(xué)理論研究和管理實(shí)踐經(jīng)驗(yàn)交流的重要學(xué)術(shù)性期刊,是高等醫(yī)藥院校藥事管理學(xué)教師從事教學(xué)和科研工作的必讀刊物。
摘要:本文應(yīng)用系統(tǒng)聚類方法,對(duì)醫(yī)學(xué)中常用的統(tǒng)計(jì)設(shè)計(jì)方案按其使用情況進(jìn)行分類,通過(guò)對(duì)類間的分析與比較,找出存在的問(wèn)題,綜合評(píng)價(jià)三年醫(yī)學(xué)統(tǒng)計(jì)設(shè)計(jì)方案的不足與可取之處,通過(guò)對(duì)醫(yī)學(xué)常用的統(tǒng)計(jì)設(shè)計(jì)方案進(jìn)行聚類,以便引起有關(guān)人員應(yīng)該對(duì)哪些統(tǒng)計(jì)設(shè)計(jì)方案更加重視,從而為提高期刊中醫(yī)學(xué)論文的質(zhì)量提供一點(diǎn)建議,對(duì)如何改進(jìn)并提高醫(yī)學(xué)論文統(tǒng)計(jì)設(shè)計(jì)方案提供一點(diǎn)參考價(jià)值。
關(guān)鍵詞:醫(yī)學(xué)論文;統(tǒng)計(jì)設(shè)計(jì)方案;聚類分析
1前言
在醫(yī)學(xué)科研中,設(shè)計(jì)主要包括專業(yè)設(shè)計(jì)和統(tǒng)計(jì)學(xué)設(shè)計(jì)兩個(gè)方面。近年來(lái),統(tǒng)計(jì)設(shè)計(jì)方案存在著很大的問(wèn)題[1],如統(tǒng)計(jì)設(shè)計(jì)方案過(guò)于簡(jiǎn)單,沒(méi)有充分體現(xiàn)處理因素間的效應(yīng);統(tǒng)計(jì)設(shè)計(jì)方案使用不當(dāng),與目的和處理因素的水平數(shù)不符。在定量資料的假設(shè)檢驗(yàn)中,誤用統(tǒng)計(jì)方法最常見的原因是忽視資料所對(duì)應(yīng)的設(shè)計(jì)類型[2]。醫(yī)學(xué)統(tǒng)計(jì)設(shè)計(jì)是進(jìn)行臨床醫(yī)學(xué)實(shí)驗(yàn)的重要前提,只有一個(gè)好的統(tǒng)計(jì)設(shè)計(jì),才能使實(shí)驗(yàn)用比較經(jīng)濟(jì)的人力、物力和時(shí)間得到一個(gè)準(zhǔn)確、可靠、重現(xiàn)性好的結(jié)果。而要得到一個(gè)好的統(tǒng)計(jì)設(shè)計(jì),必須嚴(yán)格遵循統(tǒng)計(jì)設(shè)計(jì)的4個(gè)原則:對(duì)照、均衡、隨機(jī)化、重復(fù)的原則,然后制定一個(gè)合理的統(tǒng)計(jì)設(shè)計(jì)方案[3],它直接影響到醫(yī)學(xué)期刊質(zhì)量高低,目前國(guó)內(nèi)外對(duì)醫(yī)學(xué)統(tǒng)計(jì)設(shè)計(jì)方案的研究只是針對(duì)某個(gè)設(shè)計(jì)類型應(yīng)用方法進(jìn)行分析,而對(duì)醫(yī)學(xué)中統(tǒng)計(jì)設(shè)計(jì)方案的使用質(zhì)量并未系統(tǒng)地進(jìn)行分析。為此,本文采用樣品聚類方法,對(duì)醫(yī)學(xué)中常用的9種統(tǒng)計(jì)設(shè)計(jì)方案進(jìn)行分析,通過(guò)類內(nèi)與類間的比較,找出其中存在的問(wèn)題,對(duì)改進(jìn)研究設(shè)計(jì)提供一點(diǎn)參考價(jià)值。
2材料與方法
從河北省圖書館和河北醫(yī)科大學(xué)圖書館藏書中,用單純隨機(jī)抽樣的方法抽取2000年、2001年和2002年期刊刊登的需要進(jìn)行統(tǒng)計(jì)設(shè)計(jì)的臨床醫(yī)學(xué)研究、基礎(chǔ)醫(yī)學(xué)研究文章657篇,其樣本量用率的抽樣方法進(jìn)行計(jì)算,公式如下[4]:
n--所需樣本量大小。
本次調(diào)查α=0.05,則μ0.05=1.96;δ為容許誤差(即所希望檢出的差值)。本次調(diào)查根據(jù)以往的經(jīng)驗(yàn)δ取0.04;預(yù)調(diào)查了100篇文章,其中48篇文章的統(tǒng)計(jì)設(shè)計(jì)方案存在不足之處,故本次調(diào)查p取值為0.5;為了剔除與本研究無(wú)關(guān)的文章,本文抽取了1000篇基礎(chǔ)研究與臨床研究中的醫(yī)學(xué)論文,最后剔除了非本文研究的設(shè)計(jì)類型343篇,剩余657篇,所以有效樣本量為657篇,滿足了本文需要的601篇文章。
3統(tǒng)計(jì)方法
2.1指標(biāo)的確定及其賦值
本次調(diào)查的樣品為醫(yī)學(xué)中常用的統(tǒng)計(jì)設(shè)計(jì)類型(成組設(shè)計(jì)、配對(duì)設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、交叉設(shè)計(jì)、拉丁方設(shè)計(jì)、析因設(shè)計(jì)、正交設(shè)計(jì)、重復(fù)測(cè)量設(shè)計(jì)和序貫設(shè)計(jì)),統(tǒng)計(jì)設(shè)計(jì)方案的指標(biāo)依次為無(wú)、不正確、不明確和正確[5-7],其數(shù)據(jù)結(jié)果用百分比表示[8],本次調(diào)查的統(tǒng)計(jì)設(shè)計(jì)方案主要從以下幾方面進(jìn)行判斷:與實(shí)驗(yàn)?zāi)康氖欠裣喾?處理因素的水平數(shù);區(qū)組因素的個(gè)數(shù);處理因素間有無(wú)交互作用;非處理因素的均衡情況。無(wú):指文章中沒(méi)有統(tǒng)計(jì)設(shè)計(jì)過(guò)程,沒(méi)有遵循統(tǒng)計(jì)設(shè)計(jì)的四個(gè)原則;不正確:指論文中寫明了統(tǒng)計(jì)設(shè)計(jì)方案但與上述任一方面不符者;不明確:指論文中沒(méi)有寫明具體的統(tǒng)計(jì)設(shè)計(jì)方案名稱,僅是對(duì)受試對(duì)象進(jìn)行了隨機(jī)分配并分組,無(wú)法判斷的;正確:指論文中寫明了統(tǒng)計(jì)設(shè)計(jì)方案的具體名稱,且全部條件都符合的。無(wú)、不正確、不明確和正確分別賦值為1、2、3和4。
2.2 Q型系統(tǒng)聚類
本次調(diào)查采用系統(tǒng)聚類法,聚類統(tǒng)計(jì)量用歐氏距離,類與類的距離定義為類平均法,數(shù)據(jù)處理用SAS8.0,在樣本聚類分析中,兩個(gè)樣本之間的距離越小,說(shuō)明兩個(gè)樣本的性質(zhì)越相似。類間距離是用來(lái)度量一個(gè)類(一組樣本)與另一個(gè)類(另一組樣本)之間距離的統(tǒng)計(jì)量。令類A中有a個(gè)樣本,類B中有b個(gè)樣本,D(i,j)為A中的第i個(gè)樣本與類B中的第j個(gè)樣本之間的距離,則稱D(i,j)為類A和類B中一對(duì)樣本之間的距離,i=1,2,…,a;j=1,2,…,b。假設(shè)D(A,B)為類A和類B之間的距離,本次調(diào)查的類平均法,其類間距離等于兩類中所有樣本對(duì)之間距離的平均值,即D(A,B)={sumD(i,j)}/(ab),在樣本聚類分析中兩個(gè)類的類間距離越大,則兩個(gè)類的類內(nèi)所有樣本的性質(zhì)越不相似;反之,兩個(gè)類的類間距離越小,則兩個(gè)類的類內(nèi)所有樣本的性質(zhì)越相似。系統(tǒng)聚類的基本思想是先把n個(gè)聚類樣本看成n類,然后按類間距離將相似程度最大的兩個(gè)類合并為一類,再將所有的類(包括新類)中相似程度最大的兩個(gè)類合并為一類,重復(fù)此過(guò)程,直至所有類間距離達(dá)到一定的要求為止,或直至所有n個(gè)樣本被合并成一類為止,然后根據(jù)類間距離的要求以及實(shí)際意義選擇一個(gè)適當(dāng)?shù)姆诸。把醫(yī)學(xué)常用的統(tǒng)計(jì)設(shè)計(jì)方案進(jìn)行聚類后,可以進(jìn)一步對(duì)類間及類內(nèi)進(jìn)行系統(tǒng)分析,以便找出問(wèn)題所在,提醒有關(guān)人員應(yīng)該對(duì)哪些統(tǒng)計(jì)設(shè)計(jì)方案更加重視。
2.3三年之間的比較
三年的論文使用情況在3類的構(gòu)成比的比較用χ2檢驗(yàn),兩兩比較的檢驗(yàn)水準(zhǔn)用校正的α′,其計(jì)算公式如上,統(tǒng)計(jì)處理用CS2000統(tǒng)計(jì)軟件。
4一致性檢驗(yàn)
一致性的檢驗(yàn)或盲評(píng)法復(fù)審是質(zhì)量控制的重要方法,本次調(diào)查采用一致檢驗(yàn),它可以評(píng)價(jià)本次樣品分析結(jié)果的可靠性。其評(píng)價(jià)指標(biāo)用kappa值來(lái)表示,其公式如下:
所有被評(píng)閱的文章均由作者按統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行評(píng)閱,并經(jīng)另一專業(yè)人士復(fù)查,如遇意見不一致之處,由兩人共同討論分析,以求獲得一致的結(jié)論。兩人對(duì)657篇文章的設(shè)計(jì)方案的評(píng)閱一致率為95.74%(結(jié)果見Table 1),Kappa值=0.9227,兩人對(duì)657篇論文的判斷存在一致性(u=35.1507,p<0.05),可見本次所調(diào)查的657篇文章結(jié)果是可靠的,數(shù)據(jù)處理過(guò)程使用CS2000統(tǒng)計(jì)軟件。
4結(jié)果與討論
4.1統(tǒng)計(jì)設(shè)計(jì)方案的聚類過(guò)程及樣品聚類結(jié)果的解釋
本次研究也對(duì)各種方法進(jìn)行嘗試,其中以平均距離法的分類結(jié)果最為理想。統(tǒng)計(jì)設(shè)計(jì)方案的聚類過(guò)程及樣品聚類結(jié)果的解釋(見表1和表2)如下:
有2個(gè)特征值大于1,因此至少應(yīng)分成2類。列出了聚類過(guò)程:第一步,將第5號(hào)樣本和第6號(hào)樣本合并成一類,稱為類8,記為CL8;第二步,將第1號(hào)樣本和第4號(hào)樣本合并成一類,稱為類7,記為CL7;第三步,將第7號(hào)樣本和第9號(hào)樣本合并成一類,稱為類6,記為CL6,可見CL6含有2個(gè)樣本,它們是7、9;第四步,將第3號(hào)樣本和CL8合并成一類,稱為類5,記為CL5;第五步,將CL5和第8號(hào)樣本合并成一類,稱為類4,記為CL4,可以看出,CL4含有4個(gè)樣本,它們是3、5、6、8;第六步,將CL7和第2號(hào)樣本合并成一類,稱為類3,記為CL3,此時(shí)CL3含有個(gè)樣本,它們是1、4、2;第七步,CL3和CL4合并居一類,稱為類2,記為CL2;第八步,CL2和CL6合并成一類,記為CL1。這樣所有9個(gè)樣本合并為一類。其中SPRSQ是半偏統(tǒng)計(jì)量,表明此次合并類對(duì)信息的損失程度,半偏值越小,說(shuō)明此次合并的效果越好;RSQ是統(tǒng)計(jì)量,用來(lái)評(píng)價(jià)聚類的累計(jì)效果,值越大,聚類效果越好。在這個(gè)分類結(jié)果中,根據(jù)判別指標(biāo)值,可以清楚地看到,在倒數(shù)第3行,即聚類到第6步時(shí),SPRSQ值急劇增加,從0.0967增加到0.3111,而RSQ值急劇減少,從0.759減少到0.447,因?yàn)榇藭r(shí)SPRSQ和RSQ值突然波動(dòng),所以可以決定,樣本分成3類比較合適。
聚類樹狀圖結(jié)果(見Fig.1)。從直觀上看,將這9個(gè)統(tǒng)計(jì)設(shè)計(jì)方案分為3類是比較合適的,這時(shí)類間平均距離不小于2.2164?傮w變異的75.9%被類成分所解釋。從樹狀圖中還可以直接得到分類的結(jié)果,這就是:第Ⅰ類包含1、4、2三個(gè)樣本,即重復(fù)測(cè)量設(shè)計(jì)、拉丁方設(shè)計(jì)、序貫設(shè)計(jì);第Ⅱ類包含3、5、6、8四個(gè)樣本,即交叉設(shè)計(jì)、析因設(shè)計(jì)、正交設(shè)計(jì)、配對(duì)設(shè)計(jì);第Ⅲ類包含7、9兩個(gè)樣本,即成組設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)。
4.2三年的統(tǒng)計(jì)設(shè)計(jì)方案的使用情況及在3類中構(gòu)成比的比較結(jié)果
657篇論文中,2000年、2001年和2002年的文章各占293篇、183篇、181篇。2000年、2001年和2002年在3類中的構(gòu)成比比較差別顯著(χ2=44.0895,p=0.0000),說(shuō)明3年在3類中的總體分布是不同的(見Table 11),進(jìn)一步兩兩比較的校正α′=0.0125,經(jīng)χ2檢驗(yàn),2000年與2001年的構(gòu)成比比較差異無(wú)顯著性(χ2=3.0721,p=0.2154);2000年與2002年比較差異有顯著性(χ2=41.8902,p=0.0000);2001年與2002年比較差異有顯著性(χ2=18.2208,p=0.0000)。對(duì)每一類中年的兩兩比較,其檢驗(yàn)水準(zhǔn)用校正α′=0.0125。2000年與2002年相比,Ⅰ類和Ⅱ類的構(gòu)成比差別顯著(p<0.0125),Ⅲ類差別不顯著(p>0.0125)。2001年與2002年相比,Ⅰ類和Ⅱ類的構(gòu)成比差別顯著(p<0.0125),Ⅲ類差別不顯著(p>0.0125)。其中,2002年在第Ⅰ類的有46篇,占25.41%,2000年和2001年在第Ⅰ類中的各為7.51%、11.42%,所以2002年醫(yī)學(xué)論文的使用情況要好于2000年和2001年,說(shuō)明醫(yī)學(xué)論文在這三年中的使用質(zhì)量是有所提高的。
第Ⅰ類,即析因設(shè)計(jì)、正交設(shè)計(jì)和交叉設(shè)計(jì)存在的問(wèn)題較少,但不明確的論文占的比例最高,為30.30%,所以這三種設(shè)計(jì)方案應(yīng)在以后的論文發(fā)表中將設(shè)計(jì)類型的名稱標(biāo)明。配對(duì)統(tǒng)計(jì)設(shè)計(jì)、拉丁方統(tǒng)計(jì)設(shè)計(jì)、重復(fù)測(cè)量統(tǒng)計(jì)設(shè)計(jì)存在的問(wèn)題應(yīng)用正確的程度較高,但不明確的比例也相對(duì)較高,應(yīng)注意這方面的問(wèn)題,成組統(tǒng)計(jì)設(shè)計(jì)和隨機(jī)區(qū)組設(shè)計(jì)的應(yīng)用情況最差,出現(xiàn)的問(wèn)題也最多,無(wú)的占11.55%,不正確的占17.94%,不明確的占20.35%,在三類中占的比例較高,應(yīng)該引起有關(guān)人員的注意。統(tǒng)計(jì)設(shè)計(jì)方案的使用情況不同,較好的為第Ⅰ類和第Ⅱ類,最差的為第Ⅲ類,但三類文章中均存在一定的問(wèn)題。所以重視并加強(qiáng)科研人員的統(tǒng)計(jì)學(xué)培訓(xùn)是一個(gè)任重而道遠(yuǎn)的過(guò)程,提醒有關(guān)人員引起足夠的重視。
轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///yxlw/7201.html