本文摘要:摘要:【目的/意義】在線健康社區(qū)已成為公眾獲取醫(yī)療信息和服務(wù)的重要形式。識別在線健康社區(qū)關(guān)鍵用戶及其特征,為提升健康社區(qū)服務(wù)質(zhì)量和效率提供理論依據(jù)!痉椒/過程】基于信息行為學(xué)理論構(gòu)建了包括交互行為屬性、信息質(zhì)量屬性、情感傾向?qū)傩缘亩嗑S分析框架,利用A
摘要:【目的/意義】在線健康社區(qū)已成為公眾獲取醫(yī)療信息和服務(wù)的重要形式。識別在線健康社區(qū)關(guān)鍵用戶及其特征,為提升健康社區(qū)服務(wù)質(zhì)量和效率提供理論依據(jù)!痉椒/過程】基于信息行為學(xué)理論構(gòu)建了包括交互行為屬性、信息質(zhì)量屬性、情感傾向?qū)傩缘亩嗑S分析框架,利用AttriRank算法和網(wǎng)絡(luò)抗毀性評估方法識別在線健康社區(qū)關(guān)鍵用戶!窘Y(jié)果/結(jié)論】在膽系癌癥疾病QQ群中識別出15個關(guān)鍵用戶。他們不僅具有高活躍性和高互惠度的交互行為特征,還具備多樣性水平高且結(jié)構(gòu)均衡的信息質(zhì)量特征,且多數(shù)持有正向情緒傾向。“行為+內(nèi)容+情緒”的分析框架和考慮屬性的用戶排序算法能準(zhǔn)確識別在線健康社區(qū)關(guān)鍵用戶,為在線健康社區(qū)的持續(xù)運營供了科學(xué)的決策支持!緞(chuàng)新/局限】構(gòu)建多維屬性分析框架進(jìn)行在線健康社區(qū)關(guān)鍵用戶識別,豐富了在線健康社區(qū)關(guān)鍵用戶識別的理論體系。
關(guān)鍵詞:在線健康社區(qū);關(guān)鍵用戶;屬性融合;AttriRank算法;網(wǎng)絡(luò)抗毀性評估
1引言
隨著“互聯(lián)網(wǎng)+醫(yī)療”及“健康中國2030”戰(zhàn)略導(dǎo)向的發(fā)展,公民健康意識與信息素養(yǎng)正不斷提升,促進(jìn)了一系列在線健康社區(qū)的形成與快速發(fā)展,如甜蜜家園、百度高血壓吧和以醫(yī)療健康為主題的QQ群、微信群等【1】。中國互聯(lián)網(wǎng)信息中心發(fā)布截至2020年12月,在線醫(yī)療用戶規(guī)模達(dá)2.15億,占網(wǎng)民整體的21.7%,新冠肺炎疫情期間部分第三方互聯(lián)網(wǎng)服務(wù)平臺咨詢量同比增長了20多倍【2】。
在線健康社區(qū)已逐漸成為了患者獲取健康信息的重要渠道。病患及家屬借助不同類型的在線健康社區(qū)平臺與病友、醫(yī)生、志愿者等進(jìn)行交互,搜尋醫(yī)生醫(yī)院、治療方案等信息。他們共同構(gòu)成了在線健康社區(qū),并在交互過程中不斷學(xué)習(xí)和積累經(jīng)驗,實現(xiàn)了健康信息搜尋、交互、獲取方式的進(jìn)化。
研究結(jié)果顯示,與知乎問答社區(qū)、Linux在線交流社區(qū)及Wiki編輯者社區(qū)等在線社區(qū)一樣【3】,在線健康社區(qū)中也存在一類特殊用戶【4】,對其存在和發(fā)展起到了重要的作用。他們通過積極提供健康知識、開展情感交流,帶動新用戶、潛伏用戶積極參與在線活動【5】,是社區(qū)存在和發(fā)展的重要驅(qū)動力,被稱為在線健康社區(qū)中的關(guān)鍵用戶。由此,構(gòu)建多維屬性融合的在線健康社區(qū)關(guān)鍵用戶識別方法并分析他們的行為特征,對提高在線健康社區(qū)的管理水平和服務(wù)質(zhì)量有重要的參考價值。
2相關(guān)研究現(xiàn)狀述評
在線社區(qū)上的關(guān)鍵用戶可能是輿情傳播中的“意見領(lǐng)袖”,也可能是某個特殊領(lǐng)域的自媒體。他們往往有大量的粉絲或關(guān)注者,由其提供的信息會有較大的概率被轉(zhuǎn)發(fā)和評論【6】,進(jìn)而能影響更多的普通大眾。所以已有研究成果主要考慮了關(guān)鍵用戶在社會網(wǎng)絡(luò)中的結(jié)構(gòu)位置進(jìn)行識別,如:在線社會網(wǎng)絡(luò)中節(jié)點的度數(shù)、介數(shù)、特征向量中心性等【7-9】,其優(yōu)勢是評價方法比較客觀,但是評價指標(biāo)比較單一。而在線健康社區(qū)(OnlineHealthCommunity)是一類特殊的知識型在線社區(qū),醫(yī)生、患者及其家屬都可以在不受時間和空間條件的約束下,用發(fā)文、回復(fù)、點贊、轉(zhuǎn)發(fā)等形式完成健康信息或者專業(yè)醫(yī)療知識交互【10】。
因此,在線健康社區(qū)上的關(guān)鍵用戶不僅在社會網(wǎng)絡(luò)中位置重要,還能提供醫(yī)療領(lǐng)域知識并促進(jìn)用戶之間的交流【11】。所以從信息行為學(xué)視角出發(fā),識別在線健康社區(qū)中的關(guān)鍵用戶需要綜合考慮用戶的交互行為、內(nèi)容和主題、甚至情感等多個維度【12-13】。在線健康社區(qū)用戶行為研究涉及了用戶搜索行為、分享行為和交互行為等方面。早期的用戶行為研究通過調(diào)研和統(tǒng)計分析方法,解釋了用戶的健康信息行為動機(jī),認(rèn)為利他主義、享受、自我價值等滿足感會對用戶的醫(yī)療知識共享行為產(chǎn)生顯著正向影響【14-16】。
隨著在線健康社區(qū)應(yīng)用的普及,研究熱點遷移到用戶的交互行為。劉璇等【5】研究了在線健康社區(qū)用戶的回帖行為,發(fā)現(xiàn)活躍度比較高的用戶在后續(xù)交互中獲得回復(fù)的概率比較大。這說明了高活躍度用戶是在線健康社區(qū)交互關(guān)系產(chǎn)生的動力【17】。
此外,從社會互惠理論視角來看,在線健康社區(qū)的用戶在利他心理的驅(qū)動下,通過交互行為能夠?qū)崿F(xiàn)信息價值資源的交互,比如:疾病治療的專業(yè)建議和情感支持。用戶所持有的互惠交互模式也是維持在線社區(qū)運營的重要社會性規(guī)范之一【4】。
健康信息內(nèi)容也是在線健康社區(qū)研究的一個重要分支。學(xué)者們主要采用文本挖掘、機(jī)器學(xué)習(xí)等方法對健康信息內(nèi)容或主題分布進(jìn)行識別、分類、統(tǒng)計等分析【18-21】,并關(guān)注到較差的信息質(zhì)量【22】不僅會影響用戶參與社區(qū)交互行為的發(fā)生,還會直接導(dǎo)致社區(qū)用戶流失。由于在線健康社區(qū)是一種典型的UGC社區(qū),用戶是提供知識和信息的主要來源,故而用戶所持有的信息質(zhì)量高低就決定了在線健康社區(qū)專業(yè)領(lǐng)域知識服務(wù)的水平。
一般而言,評價一個用戶信息質(zhì)量可以從信息內(nèi)容多樣性和信息結(jié)構(gòu)均衡性兩個方面出發(fā)。如:范昊等【23】研究發(fā)現(xiàn)在YahooAnswers社區(qū)中,有些關(guān)鍵節(jié)點雖然度比較大,但其貢獻(xiàn)的內(nèi)容比較單調(diào),使得社區(qū)交互結(jié)構(gòu)比較松散;翟羽佳等【24】研究則表明,百度戒煙吧由于中高活躍用戶貢獻(xiàn)的信息不均衡,導(dǎo)致論壇話語權(quán)偏移,阻礙了新用戶的參與。因此,信息質(zhì)量是識別在線健康社區(qū)中關(guān)鍵用戶不可或缺的維度。
此外,在對用戶的信息需求進(jìn)行研究時發(fā)現(xiàn),在線健康社區(qū)上的患者及家屬不僅需要專業(yè)知識的支持,情感支持和陪伴【25】等也十分重要。Beaudoin等【26】通過研究在線健康社區(qū)中的情感支持對癌癥病人情緒的影響,發(fā)現(xiàn)在線健康社區(qū)確實能夠減少癌癥病人的負(fù)向情感。同時,患者之間的交互行為可以將用戶的負(fù)向情感逐漸轉(zhuǎn)變?yōu)檎蚯楦,表明在線健康社區(qū)可以給患者及家屬提供必要的情感支持【27】。
因此,對于在線健康社區(qū)來說,用戶情感屬性也是關(guān)鍵用戶識別的重要維度。綜上所述,目前對在線健康社區(qū)的關(guān)鍵用戶識別研究還較少,需要從“行為+內(nèi)容+情緒”等多維度綜合考慮開展研究。鑒于此,本文從信息行為學(xué)角度出發(fā),構(gòu)建了交互行為屬性、信息質(zhì)量屬性和情感傾向?qū)傩灾笜?biāo);然后基于Attri⁃Rank算法和網(wǎng)絡(luò)抗毀性評估方法進(jìn)行關(guān)鍵用戶的識別和檢驗,并分析了關(guān)鍵用戶的基本特征。
3研究設(shè)計
3.1關(guān)鍵用戶識別和分析框架
本文設(shè)計了在線健康社區(qū)關(guān)鍵用戶識別和分析框架。根據(jù)信息行為學(xué)理論,提出“行為+內(nèi)容+情感”的多維度分析框架,構(gòu)建用戶交互行為屬性、信息質(zhì)量屬性、情感傾向?qū)傩。其次,根?jù)在線健康社區(qū)用戶交互行為數(shù)據(jù),構(gòu)建用戶交互網(wǎng)絡(luò)并計算用戶交互行為屬性;根據(jù)在線健康社區(qū)用戶的信息內(nèi)容數(shù)據(jù),結(jié)合百度名醫(yī)百科文本內(nèi)容及醫(yī)學(xué)詞典生成用戶交互關(guān)鍵詞,用pkuseg切詞工具和LDA主題技術(shù)識別并抽取在線健康社區(qū)的主題,并用基于詞典的情感極性分析方法分析用戶情感屬性。然后,基于AttriRank算法對用戶進(jìn)行評分和排序,通過網(wǎng)絡(luò)抗毀性評估和檢驗社區(qū)內(nèi)的關(guān)鍵用戶效用,并分析關(guān)鍵用戶的屬性特征。
3.2用戶屬性
在線健康社區(qū)中的用戶可以通過提問、回答、評論等在網(wǎng)絡(luò)上進(jìn)行交互。以用戶作為節(jié)點,用戶之間的交互關(guān)系作為連邊,兩者構(gòu)成了一個復(fù)雜的交互網(wǎng)絡(luò),可以記為G=(V,E)。其中V是交互網(wǎng)絡(luò)中的節(jié)點集合,且V中的每個節(jié)點i均具有交互行為屬性、信息質(zhì)量屬性和情感傾向?qū)傩。E是用戶交互關(guān)系構(gòu)成的有向邊集合,∀e ∈E,表示節(jié)點i提及(@)、轉(zhuǎn)發(fā)或者評論節(jié)點j的信息,即節(jié)點i主動與j進(jìn)行交互。
3.3關(guān)鍵用戶識別方法
3.3.1AttriRank算法
AttriRank是同時考慮網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)中節(jié)點屬性的無監(jiān)督節(jié)點重要性排序方法【29】。該算法以PageRank算法為基礎(chǔ),同時考慮節(jié)點的多維度屬性,對網(wǎng)絡(luò)中的每個節(jié)點進(jìn)行打分。
4實例及分析
4.1數(shù)據(jù)集簡介
本文選擇了肝膽外科中膽系癌癥QQ群社區(qū)為研究對象,它是國內(nèi)較大、人數(shù)較多、交流較為活躍自發(fā)病友群,共包含2780個用戶,涉及30個省市(臺灣、西藏、香港和澳門除外)。本文收集了社區(qū)內(nèi)2020.07.01-2020.12.31共6個月的聊天文本,共獲取197649條有效數(shù)據(jù)。由于膽系癌癥發(fā)病率低且惡性程度高,患者和家屬對此病癥知識了解途徑比較少,所以在QQ群社區(qū)中,用戶間交互比較頻繁。
一般而言,用戶可以根據(jù)社區(qū)中的上下文隨意加入到聊天列表中。另外一種方式是用戶通過@提及某個特殊用戶,進(jìn)行提問或者回答等交互。由此,將QQ群社區(qū)中用戶作為交互網(wǎng)絡(luò)的節(jié)點,根據(jù)第二種交互方式生成有向邊添加到交互網(wǎng)絡(luò)。最終該健康社區(qū)的交互網(wǎng)絡(luò)由2780個節(jié)點和11000條有向邊組成,過濾掉孤立節(jié)點后得到社區(qū)最大連通分量圖。
節(jié)點的大小與該節(jié)點度的大小相對應(yīng)。交互網(wǎng)絡(luò)結(jié)構(gòu)統(tǒng)計結(jié)果為:節(jié)點平均度為3.957,即每個用戶會與3至4個人發(fā)生交互;模塊度為0.173,說明用戶交互中形成了明顯的社區(qū)結(jié)構(gòu);平均路徑長度為2.698,聚類系數(shù)為0.17,兩者表明該交互中存在較短的信息傳輸路徑,可以使健康信息在社區(qū)中快速傳播。此外,根據(jù)在線健康社區(qū)用戶的聊天內(nèi)容數(shù)據(jù),結(jié)合百度名醫(yī)百科文本內(nèi)容及醫(yī)學(xué)詞典生成用戶交互關(guān)鍵詞集合KW,包含關(guān)鍵詞89516個;用pkuseg切詞工具與LDA主題技術(shù)結(jié)合,識別并抽取在線健康社區(qū)的主題集合Γ,共包含6個主題。
在雙對數(shù)坐標(biāo)系下,多樣性值較小的用戶均質(zhì)性值比較分散,多樣性值偏大的用戶均質(zhì)性接近1。也就是對于普通用戶而言,受到自身知識背景、病程、病癥等因素影響,他們聊天內(nèi)容涉及的信息量和主題范圍有較大的局限性。而關(guān)鍵用戶則是要給不同病程和病癥的患者和家屬提供健康醫(yī)療知識,所以其信息多樣性和均質(zhì)性值均名列前茅。
有70.1%用戶的情感傾向度值低于m-,29.9%的用戶情感傾向度值高于m-。其中,關(guān)鍵用戶的情感傾向度均處于較高的水平:情感傾向度的最小值是0.64476,是均值的1.5142倍,情感傾向度的最大值是2.51826,是均值的5.91418倍。此外,關(guān)鍵用戶情感傾向度主要集中在1附近,表明關(guān)鍵用戶在交互過程中傾向于表達(dá)正向情感,且沒有明顯的極端性,這對于維持良好的社區(qū)氛圍起到了重要的作用。
5結(jié)語
本文研究在線健康社區(qū)關(guān)鍵用戶識別和特征分析問題。首先為關(guān)鍵用戶的識別構(gòu)建出多維融合屬性指標(biāo)體系,從交互行為屬性、信息質(zhì)量屬性和情感傾向?qū)傩匀齻維度,構(gòu)建了用戶的活躍度、互惠度,信息的多樣性、均質(zhì)性,情感傾向 度等5個分析指標(biāo)。其次是構(gòu)建關(guān)鍵用戶識別方法,諸如PageRank等經(jīng)典的關(guān)鍵用戶識別算法不適用于在線健康社區(qū),應(yīng)結(jié)合用戶多維屬性開展在線健康社區(qū)關(guān)鍵用戶識別和特征分析。
因此本文在AttriRank算法基礎(chǔ)上獲取用戶評價結(jié)果和排名,通過網(wǎng)絡(luò)抗毀性評估方法識別在線健康社區(qū)關(guān)鍵用戶。本文以膽系癌癥的患者和家屬自發(fā)形成的QQ群社區(qū)為研究對象開展了實證驗證,在膽系癌癥QQ群社區(qū)中識別出15個關(guān)鍵用戶。
研究結(jié)果表明:第一,在線健康社區(qū)中的關(guān)鍵用戶比普通用戶有較高的交互意愿,他們的作用不僅體現(xiàn)在與普通用戶發(fā)生交互,而且還是社區(qū)中健康信息和醫(yī)療知識的主要傳播者;第二,在線健康社區(qū)中的關(guān)鍵用戶不僅比普通用戶擁有更多信息,而且信息結(jié)構(gòu)更均衡,是社區(qū)中主要的知識和經(jīng)驗來源及載體;第三,在線健康社區(qū)中的關(guān)鍵用戶極少有極端情緒表現(xiàn),能給普通用戶提供適度的正向情感支持。在未來的工作中,可結(jié)合時間感知框架設(shè)計動態(tài)環(huán)境下的關(guān)鍵用戶識別算法,進(jìn)一步提高健康信息服務(wù)水平,為促進(jìn)社區(qū)發(fā)展提供更多的合理建議。
參考文獻(xiàn)
1趙棟祥.國內(nèi)在線健康社區(qū)研究現(xiàn)狀綜述[J].圖書情報工作,2018,62(9):134-142.
2中國互聯(lián)網(wǎng)絡(luò)信息中心.第47次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[EB/OL].[2021-02-03].
3柯陽,隋杰.基于用戶特征屬性的微博話題關(guān)鍵用戶挖掘[J].計算機(jī)應(yīng)用研究,2019,36(6):1614-1617,1622.
4吳江,周露莎.在線醫(yī)療社區(qū)中知識共享網(wǎng)絡(luò)及知識互動行為研究[J].情報科學(xué),2017,35(3):144-151.
5劉璇,汪林威,李嘉,張朋柱.在線健康社區(qū)中用戶回帖行為影響機(jī)理研究[J].管理科學(xué),2017,30(1):62-72.
6席海濤,聶文博,李閨臣,田慧敏,陳立.在線健康社區(qū)用戶交互的研究現(xiàn)狀與進(jìn)展[J].情報科學(xué),2021,39(4):186-193.
7FREEMANLC.Asetofmeasuresofcentralitybasedonbetweenness[J].Sociometry,1977,40(1):35-41.
8FREEMANLC.Centralityinsocialnetworksconcep⁃tualclassification[J].SocialNetworks,1978,1(3):215-239.
作者:張軍,李新旺,李鵬
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/29626.html