亚洲一区人妻,久久三级免费,国模少妇无码一区二区三区,日韩av动漫

國(guó)內(nèi)或國(guó)外 期刊或論文

您當(dāng)前的位置:發(fā)表學(xué)術(shù)論文網(wǎng)經(jīng)濟(jì)論文》 融合PageRank與評(píng)論情感傾向的在線健康社區(qū)用戶影響力研究> 正文

融合PageRank與評(píng)論情感傾向的在線健康社區(qū)用戶影響力研究

所屬分類:經(jīng)濟(jì)論文 閱讀次 時(shí)間:2021-07-02 11:01

本文摘要:摘要:[目的/意義]在線健康社區(qū)中對(duì)高影響力用戶的有效識(shí)別,有助于健康信息需求者發(fā)現(xiàn)有價(jià)值的健康信息,對(duì)于降低健康信息查找成本和提高健康行為決策的有效性具有重要意義。[方法/過(guò)程]從用戶交互性和評(píng)論情感傾向出發(fā),利用PageRank和SVM等算法構(gòu)建出在線

  摘要:[目的/意義]在線健康社區(qū)中對(duì)高影響力用戶的有效識(shí)別,有助于健康信息需求者發(fā)現(xiàn)有價(jià)值的健康信息,對(duì)于降低健康信息查找成本和提高健康行為決策的有效性具有重要意義。[方法/過(guò)程]從用戶交互性和評(píng)論情感傾向出發(fā),利用PageRank和SVM等算法構(gòu)建出在線健康社區(qū)用戶影響力的測(cè)量方法,并以醫(yī)享網(wǎng)為實(shí)驗(yàn)對(duì)象,從發(fā)布內(nèi)容使用價(jià)值的視角,進(jìn)一步計(jì)算了該社區(qū)中用戶的綜合影響力,并對(duì)案例用戶進(jìn)行分析。[結(jié)果/結(jié)論]分析結(jié)果表明該算法具有一定的合理性,能夠?qū)ageRank算法的影響力計(jì)算結(jié)果進(jìn)行優(yōu)化;同時(shí),利用TFIDF和互信息算法揭示了高綜合影響力用戶發(fā)布的信息內(nèi)容與社區(qū)其他用戶群體內(nèi)容主題基本一致,該類用戶對(duì)社區(qū)的主題方向起到一定的引導(dǎo)作用。因此,通過(guò)本研究所構(gòu)建的方法可以有效識(shí)別高影響力的用戶,有助于健康信息需求者及時(shí)準(zhǔn)確的發(fā)現(xiàn)所需信息,提高健康信息的使用效果,從而豐富在線健康社區(qū)用戶信息行為的理論和實(shí)踐研究。

  關(guān)鍵詞:PageRank 情感傾向在線健康社區(qū)用戶影響力

在線健康社區(qū)

  1 引言

  “互聯(lián)網(wǎng)+醫(yī)療”發(fā)展戰(zhàn)略是順應(yīng)時(shí)代的產(chǎn)物,也是向智能醫(yī)療轉(zhuǎn)變的必經(jīng)之路。用戶不僅可以在線預(yù)約掛號(hào)、查閱資料,還能夠得到意向領(lǐng)域?qū)<业慕獯鸹蛘卟∮训慕?jīng)驗(yàn)傳授與討論,縮短傳統(tǒng)醫(yī)療中尋根問(wèn)藥的時(shí)間成本,大大提高了用戶的參與感與治療效率。

  健康論文范例:體檢中心對(duì)亞健康人群健康管理模式的探討

  據(jù)醫(yī)療相關(guān)數(shù)據(jù)顯示,2018年全國(guó)超過(guò)99萬(wàn)家衛(wèi)生機(jī)構(gòu)總會(huì)診人次達(dá)到33.8億[1],2019年在線咨詢總量達(dá)5.6億次,未來(lái)將持續(xù)保持上升趨勢(shì)[2]。同時(shí),《“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見(jiàn)》[3]也鼓勵(lì)在線健康社區(qū)運(yùn)用互聯(lián)網(wǎng)的相關(guān)技術(shù)加快實(shí)現(xiàn)資源互通、信息共享與遠(yuǎn)程醫(yī)療等服務(wù),不斷健全互聯(lián)網(wǎng)+醫(yī)療的一體化服務(wù)體系,加強(qiáng)醫(yī)院、醫(yī)生與患者間的有效溝通。

  目前,國(guó)內(nèi)健康問(wèn)題討論規(guī)模較大的在線社區(qū)以醫(yī)享網(wǎng)、39健康論壇與好大夫在線等網(wǎng)站為主,這些在線社區(qū)用戶多,知識(shí)傳播速度快,產(chǎn)生了大量的信息與數(shù)據(jù),為健康信息需求用戶提供了有價(jià)值的健康信 息。在線社區(qū)中存在一些活躍程度較高的用戶,他們能夠吸引到其他用戶的關(guān)注和互動(dòng),從而在一定程度上影響其他用戶的信息行為和健康決策,對(duì)于整個(gè)在線社區(qū)的信息傳播具有較強(qiáng)的導(dǎo)向作用。

  然而,用戶的活躍程度與其所發(fā)布的信息的使用價(jià)值間并非存在直接關(guān)系,如一些用戶具有較強(qiáng)的交互影響力,在社區(qū)活躍程度較高,求助和抒發(fā)情感等行為頻繁,所發(fā)布的信息也受到較多關(guān)注,但其他用戶對(duì)其評(píng)價(jià)不高,在一定程度上反映了其信息的使用價(jià)值有限;還有一些用戶盡管交互活躍程度不高,但其所發(fā)布的信息受到的積極評(píng)價(jià)較多,其所發(fā)布的信息具有較好的應(yīng)用價(jià)值。

  因此,從信息使用價(jià)值角度出發(fā),如何結(jié)合用戶活躍性和交互情感傾向性識(shí)別來(lái)判斷在線健康社區(qū)用戶的綜合影響力,對(duì)于幫助用戶便捷、有效地利用健康信息,做出客觀的健康行為決策等方面具有重要意義。本研究擬在融合用戶交互活躍性和評(píng)論情感傾向的基礎(chǔ)上,探索性地構(gòu)建在線健康社區(qū)用戶綜合影響力的測(cè)量算法,并在相應(yīng)的在線健康社區(qū)中進(jìn)行實(shí)驗(yàn)和結(jié)果分析,以期為有效挖掘在線健康社區(qū)中有影響力的用戶和有價(jià)值的健康信息提供一定的方法和參考。

  2 相關(guān)研究

  用戶影響力的分析與測(cè)量是在線社交媒體和在線社區(qū)相關(guān)研究領(lǐng)域中,學(xué)者所關(guān)注的重要研究方向之一。目前關(guān)于用戶影響力的相關(guān)研究主要采用特征值統(tǒng)計(jì)分析方法、社會(huì)網(wǎng)絡(luò)分析方法以及PageRank方法等。

  特征值統(tǒng)計(jì)分析方法主要通過(guò)統(tǒng)計(jì)能夠反映在線社區(qū)用戶活躍特征的相關(guān)特征值,并進(jìn)行一定的指標(biāo)和權(quán)重的設(shè)定,從而計(jì)算用戶的影響力。如王佳敏等[4]在分析用戶影響力時(shí),主要統(tǒng)計(jì)了影響力指標(biāo)和活躍度兩個(gè)指標(biāo),其中影響力指標(biāo)包括粉絲數(shù)、被轉(zhuǎn)發(fā)數(shù)、被評(píng)論數(shù)、是否認(rèn)證4個(gè)特征值,活躍度指標(biāo)包括微博數(shù)和關(guān)注人數(shù)兩個(gè)特征值。趙發(fā)珍等[5]利用博客的引用數(shù)量、回復(fù)數(shù)量、網(wǎng)頁(yè)內(nèi)外鏈接數(shù)等特征值進(jìn)行用戶影響力的建模。董偉等[6]也通過(guò)獲取和分析在線社區(qū)中用戶的留存時(shí)間、發(fā)帖量、粉絲數(shù)等反映個(gè)人和交互維度的相關(guān)特征值,對(duì)活躍用戶進(jìn)行了識(shí)別,并對(duì)其在社區(qū)中的影響力進(jìn)行了分析。

  社會(huì)網(wǎng)絡(luò)分析方法主要通過(guò)關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)中的屬性值來(lái)計(jì)算各個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性,如網(wǎng)絡(luò)密度、點(diǎn)度中心性、中介中心性、接近中心性及等。陳遠(yuǎn)等[7]通過(guò)分析社會(huì)網(wǎng)絡(luò)的中心度、結(jié)構(gòu)洞等指標(biāo)來(lái)挖掘在線社區(qū)中用戶的影響力。謝英香等[8]則通過(guò)對(duì)社會(huì)網(wǎng)絡(luò)分析法中的中心度的分析,利用MDS等方法,分析了虛擬社區(qū)中的用戶的影響力,并進(jìn)一步揭示該社區(qū)存在意見(jiàn)領(lǐng)袖現(xiàn)象。S.Jonnalagadda[9]等則綜合分析了點(diǎn)度中心性、點(diǎn)度中介性、以及點(diǎn)度緊密性等反映中心的指標(biāo),從而發(fā)現(xiàn)了醫(yī)學(xué)在線社區(qū)中具有較大影響的意見(jiàn)領(lǐng)袖。

  3 研究設(shè)計(jì)

  3.1 研究思路

  本研究的思路主要包括四個(gè)步驟,首先是利用數(shù)據(jù)爬蟲(chóng)對(duì)在線社區(qū)相關(guān)信息進(jìn)行爬取,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,并將最終可用的數(shù)據(jù)存入數(shù)據(jù)庫(kù),包括用戶和評(píng)論信息兩個(gè)方面。其次,是對(duì)用戶的綜合影響力進(jìn)行計(jì)算,綜合影響力主要包括三項(xiàng)子算法:①利用PageRank算法對(duì)用戶的交互影響力進(jìn)行計(jì)算;②通過(guò)選擇最優(yōu)情感分類模型,對(duì)評(píng)論信息進(jìn)行情感歸類與分析,并進(jìn)一步對(duì)評(píng)論信息情感傾向值進(jìn)行計(jì)算;③融合上述兩內(nèi)容的結(jié)果按照特定公式進(jìn)行融合,并通過(guò)案例分析進(jìn)行對(duì)比。再次,利用TFIDF與互信息算法進(jìn)一步探究高綜合影響力用戶所生產(chǎn)的信息內(nèi)容與社區(qū)其他用戶群體內(nèi)容主題方向的關(guān)系,并通過(guò)可視化的方法進(jìn)行比較分析。最后,對(duì)本研究的研究過(guò)程和方法進(jìn)行總結(jié),并提出相應(yīng)的研究展望。

  3.2 數(shù)據(jù)獲取與預(yù)處理

  本研究以健康社區(qū)中的用戶所發(fā)布的信息及其評(píng)論信息為分析對(duì)象,使用Python語(yǔ)言構(gòu)建多線程爬蟲(chóng)工具,以Cookie參數(shù)與報(bào)頭信息作為用戶與瀏覽器表征工具,通過(guò)解析DOM樹(shù)獲得該社區(qū)中用戶交流之間的相關(guān)內(nèi)容,包括用戶昵稱、發(fā)帖內(nèi)容與相應(yīng)的回帖信息。

  此外,進(jìn)一步對(duì)相關(guān)數(shù)據(jù)進(jìn)行預(yù)處理,如分詞處理、用戶編碼映射表構(gòu)建、用戶評(píng)論映射表構(gòu)建、用戶評(píng)論者映射表構(gòu)建、異常用戶處理等。本研究擬以醫(yī)享網(wǎng)社區(qū)的用戶生成內(nèi)容為例,并收集相應(yīng)數(shù)據(jù)進(jìn)行相關(guān)實(shí)驗(yàn)和分析。

  3.3 分析過(guò)程與技術(shù)

  傳統(tǒng)PageRank算法中,較多考慮的是網(wǎng)站或者用戶之間的交互關(guān)系與權(quán)重,并不對(duì)其本身質(zhì)量進(jìn)行分析,故本研究結(jié)合用戶交互關(guān)系與用戶評(píng)論等信息內(nèi)容進(jìn)行分析,一方面發(fā)掘潛在網(wǎng)絡(luò)用戶影響力排名;另一方面對(duì)用戶情感傾向進(jìn)行識(shí)別,并融合兩者進(jìn)行綜合性探究。

  4 研究結(jié)果

  4.1 實(shí)驗(yàn)數(shù)據(jù)

  醫(yī)享網(wǎng)是國(guó)內(nèi)在線健康社區(qū)中用戶較多,可信度較高的社區(qū)之一,支持病例庫(kù)查詢,在線健康問(wèn)題問(wèn)答,其中痛風(fēng)圈社區(qū)的內(nèi)容交互較為頻繁,論述相對(duì)全面[21]。故本研究設(shè)置醫(yī)享網(wǎng)的痛風(fēng)圈作為數(shù)據(jù)來(lái)源,收集時(shí)間為2020年2月,依據(jù)相關(guān)公開(kāi)內(nèi)容,設(shè)計(jì)爬蟲(chóng)程序進(jìn)行數(shù)據(jù)抽取,具體數(shù)據(jù)主要包括用戶昵稱、發(fā)帖與回帖內(nèi)容。

  進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分詞處理,即使用JIBEA對(duì)用戶文本進(jìn)行分詞,以進(jìn)行高頻詞統(tǒng)計(jì)和互信息模型構(gòu)建;用戶編碼映射表構(gòu)建,即對(duì)所有用戶進(jìn)行統(tǒng)一編碼,如用戶1、用戶2等順排至最后;用戶評(píng)論映射表,即對(duì)用戶所發(fā)表的評(píng)論內(nèi)容進(jìn)行對(duì)應(yīng);用戶評(píng)論者映射表,即構(gòu)建評(píng)論用戶1、用戶2等的用戶評(píng)論映射表;異常用戶處理即過(guò)濾掉評(píng)論或發(fā)帖與通風(fēng)圈無(wú)關(guān)的用戶,如推送廣告用戶等。經(jīng)過(guò)最終預(yù)處理,共得到292位有效用戶的2560條有效交互內(nèi)容。

  4.2.3 基于互信息的綜合影響力用戶文本內(nèi)容分析結(jié)果

  為進(jìn)一步探究高綜合影響力用戶對(duì)健康社區(qū)主題方向的影響,本研究選取了前20個(gè)高綜合影響力用戶和社區(qū)其他用戶評(píng)論內(nèi)容進(jìn)行實(shí)驗(yàn),通過(guò)TFIDF與互信息兩種算法,構(gòu)建了該用戶群的詞條共現(xiàn)網(wǎng)絡(luò),為了更直觀和清楚展示其關(guān)聯(lián)效果與整體結(jié)構(gòu),借助Vosviewer軟件對(duì)該共現(xiàn)網(wǎng)絡(luò)進(jìn)行了可視化分析。其中,疼痛、結(jié)晶、血癥、高尿酸、發(fā)作、關(guān)節(jié)、止痛、代謝、含量等半徑較大的15個(gè)節(jié)點(diǎn)代表高頻詞匯,而半徑較小的其他節(jié)點(diǎn)分別表示每個(gè)高頻詞的10個(gè)互信息關(guān)鍵詞,相連表示對(duì)應(yīng)的一組數(shù)據(jù)。

  高綜合影響力用戶主要關(guān)注的幾個(gè)問(wèn)題集中在三個(gè)方面,其一是當(dāng)痛風(fēng)病發(fā)作的時(shí)候的表現(xiàn),如疼痛、臨睡前、侵蝕、結(jié)晶、沉淀、磷脂、關(guān)節(jié)、神經(jīng)等關(guān)鍵詞均在不同方面說(shuō)明了病癥發(fā)生的癥狀、時(shí)間等內(nèi)容;其二是治療痛風(fēng)所使用的藥物,包括秋水仙堿、雙氯芬酸鈉、阿西美辛、戴芬、秋水仙、別嘌呤、抗炎藥、止痛針等內(nèi)容;其三,為了更好的治療痛風(fēng)所采用的食療輔助,如特別注意龍須菜、菠菜、蘑菇、鮮豌豆類含嘌呤較多的蔬菜,蛤類、動(dòng)物內(nèi)臟、多飲水、少喝湯等。

  5 總結(jié)與展望

  5.1 研究總結(jié)

  本研究從交互影響力和情感傾向兩個(gè)視角出發(fā),基于SVM算法的線性核函數(shù)建立了情緒識(shí)別模型,對(duì)文本有效性進(jìn)行了識(shí)別與分析,并結(jié)合交互影響力與情感傾向性探討了用戶綜合影響力,得出以下結(jié)論:

  首先,本研究通過(guò)對(duì)用戶交互影響力的計(jì)算,并結(jié)合相關(guān)案例,發(fā)現(xiàn)交互影響力更多強(qiáng)調(diào)了交互活躍性,但對(duì)于揭示用戶信息資源的有效性方面存在一定不足,因此并不能完全客觀的反映出用戶的真實(shí)影響力,需要引入評(píng)論情感傾向值對(duì)影響力做進(jìn)一步的融合計(jì)算。

  其次,通過(guò)對(duì)比機(jī)器學(xué)習(xí)的五種關(guān)于情感計(jì)算的主要算法中,發(fā)現(xiàn)SVM算法對(duì)于本文構(gòu)建的評(píng)論情感傾向分類模型效果最優(yōu),為有效的計(jì)算用戶綜合影響力提供了技術(shù)支撐。

  再次,本研究探索性地將PageRank交互影響力與評(píng)論情感傾向進(jìn)行融合計(jì)算,并通過(guò)相應(yīng)個(gè)案分析從信息內(nèi)容的角度對(duì)高影響力用戶做了進(jìn)一步驗(yàn)證,在一定程度上說(shuō)明了本研究中的綜合影響力的算法具有較好的合理性和適用性。

  此外,通過(guò)對(duì)高綜合影響力的高頻詞-互信息矩陣與其他用戶群體的高頻詞-互信息矩陣的比較發(fā)現(xiàn),二者相似程度較高,基本主題方向一致,這也在一定程度上說(shuō)明了尋找高綜合影響力用戶的必要性,也進(jìn)一步說(shuō)明本研究的用戶影響力綜合計(jì)算方法可較為客觀的識(shí)別出主導(dǎo)健康社區(qū)內(nèi)容方向的具有較高影響力的用戶,有助于健康信息需求者能夠及時(shí)、準(zhǔn)確從健康社區(qū)中獲得所需有價(jià)值的信息,提升健康信息的利用效果。

  5.2 研究展望

  本文提出了一種情緒識(shí)別模型以探索用戶生成內(nèi)容的情感傾向,從而構(gòu)建用戶綜合影響力的研究方法,并進(jìn)一步通過(guò)具體內(nèi)容分析論述了高綜合影響力用戶對(duì)社區(qū)方向的影響,但也存在一定的不足:

  (1)交互影響力和情感分析算法的優(yōu)化。本研究用戶交互影響力主要基于PageRank算法,雖然該方法應(yīng)用較為廣泛,但其在分析用戶影響力方面仍存在一定的改進(jìn)空間,可在今后的研究中,結(jié)合用戶行為特征對(duì)該算法做進(jìn)一步的優(yōu)化。此外,本研究中所用到的情感傾向分析的算法,今后可對(duì)更多的相關(guān)算法和框架進(jìn)行比較分析,從而進(jìn)一步提升相關(guān)計(jì)算的效率和準(zhǔn)確性。

  (2)研究數(shù)據(jù)的進(jìn)一步豐富。本研究主要基于醫(yī)享網(wǎng)的痛風(fēng)病圈數(shù)據(jù)進(jìn)行了研究,在今后的研究中,可以進(jìn)一步擴(kuò)展健康社區(qū)的數(shù)據(jù)獲取范圍,通過(guò)比較不同健康社區(qū)中用戶綜合影響力的分布和特征,以不斷拓展和驗(yàn)證本研究的適用性。

  參考文獻(xiàn):

  [1]楊梓.最新!衛(wèi)健委發(fā)布全國(guó)醫(yī)療相關(guān)數(shù)據(jù)[EB/OL].[2021-04-27].https://www.sohu.com/a/247593213_439958.

  [2]2018年中國(guó)健康醫(yī)療大數(shù)據(jù)行業(yè)發(fā)展現(xiàn)狀及發(fā)展趨勢(shì)分析[EB/OL].[2021-04-27].http://www.chyxx.com/industry/201806/649591.html.

  作者:董偉陶金虎

轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/27301.html