本文摘要:摘 要 目的 探討肥胖程度與常見慢性病之間的關(guān)聯(lián)關(guān)系,為常見慢病的預(yù)防和管理提供大數(shù)據(jù) 支撐。 方法 基于社區(qū)公共衛(wèi)生系統(tǒng)數(shù)據(jù)集,通過使用 Apriori 關(guān)聯(lián)規(guī)則算法挖掘高血壓、冠心
摘 要 目的 探討肥胖程度與常見慢性病之間的關(guān)聯(lián)關(guān)系,為常見慢病的預(yù)防和管理提供大數(shù)據(jù) 支撐。 方法 基于社區(qū)公共衛(wèi)生系統(tǒng)數(shù)據(jù)集,通過使用 Apriori 關(guān)聯(lián)規(guī)則算法挖掘高血壓、冠心病、糖尿病 這 3 種常見慢病與肥胖程度(超重或肥胖)之間的關(guān)聯(lián)關(guān)系,并根據(jù)關(guān)聯(lián)規(guī)則的支持度、置信度和提升 度評價肥胖程度對發(fā)生常見慢病的影響。 結(jié)果 共對 196 554 名居民的健康數(shù)據(jù)進(jìn)行分析,高血壓的患 病率(48 6%)明顯高于冠心病(22 9%)和糖尿病(20 3%) ,51 0%的人至少患有其中一種慢病,10 6% 的人同時患有該 3 種慢病。 關(guān)聯(lián)規(guī)則分析結(jié)果顯示,超重與高血壓、冠心病之間均有強(qiáng)關(guān)聯(lián)性,肥胖與 高血壓之間也有強(qiáng)關(guān)聯(lián)性,而糖尿病與體型因素的關(guān)聯(lián)性較弱。 3 種慢病之間均有強(qiáng)關(guān)聯(lián)性,飲食嗜好 與這 3 種慢病都有關(guān)聯(lián),老年人常常伴隨發(fā)生高血壓、糖尿病與冠心病。 結(jié)論 超重和肥胖會增加高血 壓、冠心病和糖尿病的發(fā)生風(fēng)險,因此,為盡可能減少這些慢病的發(fā)生,健康人群要關(guān)注自身的肥胖情 況,特別是老年人、有飲食偏好的人以及女性。
關(guān)鍵詞 高血壓;冠心病;糖尿病;肥胖;關(guān)聯(lián)規(guī)則挖掘
0 引言
我國居民常見的慢性疾病,如冠心病、高血壓、 糖尿病,逐漸呈現(xiàn)發(fā)病率上升、發(fā)病年齡降低的趨 勢。 這些疾病通常病程長且難以治愈,而且會導(dǎo)致 其他疾病的發(fā)生或加重[1] 。 而我國醫(yī)療衛(wèi)生系統(tǒng) 目前仍存在人員配置不足、資源分布不均等問題,難 以滿足快速增長的慢性病防治需求,因此預(yù)防慢性 病的發(fā)生成為重中之重。
有研究[2-4] 表明,多項慢 性病相關(guān)危險因素的聯(lián)合作用會增加心血管疾病、 糖尿病腎病和癌癥等的發(fā)生及死亡風(fēng)險,所以發(fā)現(xiàn) 慢病的潛在危險因素十分必要。 研究發(fā)現(xiàn),慢性病 通常以慢性共患病的形式出現(xiàn)。 因此通過分析常見 慢性病之間的關(guān)聯(lián)性,制定有效的綜合防治措施,有 助于改善慢性病防治效果[5-6] 。
隨著社會經(jīng)濟(jì)的快速發(fā)展和人們生活方式的 改變,一些不良生活習(xí)慣或不良工作環(huán)境及其造 成的身體負(fù)擔(dān)加速了各種慢性病的擴(kuò)大化和普遍 化。 根 據(jù) 《 中 國 居 民 營 養(yǎng) 與 慢 性 病 狀 況 報 告 (2015) 》的闡述,吸煙、過量飲酒、身體活動不足和 不健康飲食已成為我國成人居民慢性病發(fā)生、發(fā) 展的主要行為危險因素[ 7] 。
此外,我國成人的肥 胖率已達(dá) 11 9%[ 7] ,越來越多的研究[ 8-12] 開始涉 及體型與這些慢病發(fā)生的關(guān)系及其對人體健康的 影響。 有研究顯示[ 13] ,老年人肥胖者和超重者慢 性病的發(fā)病率高于體重正常者,且肥胖者比超重 者慢性病的發(fā)病率更高。 但其研究使用的人口樣 本小,且僅統(tǒng)計了患病概率而未研究肥胖程度與 慢性病的關(guān)聯(lián)性強(qiáng)弱。 據(jù)此,本研究利用北京市某社區(qū)居民健康數(shù)據(jù) 系統(tǒng)集,對高血壓、冠心病和糖尿病的潛在影響因素,特別是肥胖程度進(jìn)行關(guān)聯(lián)規(guī)則挖掘與分析,找出 危險因素之間的關(guān)聯(lián)性和關(guān)聯(lián)強(qiáng)度,從而為這 3 種 慢性病的針對性篩查和防治提供有效的建議,以減 少慢性病的發(fā)生。
1 材料和方法
1 1 數(shù)據(jù)來源與數(shù)據(jù)篩選
數(shù)據(jù)來源于北京市某社區(qū)公共衛(wèi)生系統(tǒng)數(shù)據(jù) 集,其中包含有人口學(xué)數(shù)據(jù),如性別、年齡、工作情況 等;家族史、本人慢性病患病情況,如高血壓、糖尿 病、冠心病、腦卒中等;生活習(xí)慣,如吸煙、飲酒、鍛 煉、飲食嗜好等,共計 101 個指標(biāo)。 本研究提取性 別、年齡、身高、體重、是否患高血壓、是否患糖尿病、 是否患冠心病、是否患腦卒中、是否患其他慢病、是 否藥物過敏、父母有無高血壓、父母有無糖尿病、有 無兄弟姐妹病史、有無子女病史、吸煙、飲酒、鍛煉、 飲食嗜好共 18 個主要指標(biāo)進(jìn)行分析。
根據(jù)身高和體重計算體重指數(shù) BMI,參考世界 衛(wèi)生組織的標(biāo)準(zhǔn),以 BMI<18 5 kg / m2 定義為偏瘦, 18 5 kg / m2≤BMI< 24 kg / m2 定義為正常,24 kg / m2 ≤BMI<28 kg / m2 定義為超重,BMI≥28 kg / m2 定義 為肥胖。 將年齡大于 60 歲定義為老年,將飲食嗜好 的指標(biāo)細(xì)分為是否偏咸、是否偏甜、是否偏油、是否 偏燙、是否吃素、是否吃辣共 6 項指標(biāo)。
1 2 數(shù)據(jù)挖掘與關(guān)聯(lián)規(guī)則
數(shù)據(jù)挖掘技術(shù)是一種通過各種工具與手段將未 知的、大量的、有潛在實用價值的數(shù)據(jù)自動地、智能 地轉(zhuǎn)化為對人們有使用意義的信息、知識的技術(shù),它 是數(shù)據(jù)庫快速發(fā)展和智能化的產(chǎn)物。 數(shù)據(jù)挖掘技術(shù) 能夠幫助技術(shù)人員從大量的數(shù)據(jù)庫文件數(shù)據(jù)或其他 信息文件數(shù)據(jù)中發(fā)現(xiàn)并提取出人們感興趣的信息與知識,而基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘則是一種有效的 數(shù)據(jù)挖掘方法[14-15] 。
關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)處理算法從龐大而冗雜的 數(shù)據(jù)項集中獲取各個數(shù)據(jù)對象之間不同程度上的關(guān) 聯(lián)性,而從這些關(guān)聯(lián)性組合中可以預(yù)見到數(shù)據(jù)項之 間的依賴性,因此,根據(jù)這些關(guān)聯(lián)性的組合可以從其 中一些數(shù)據(jù)對象的信息推測一些未來的適用于大多 數(shù)情況的數(shù)據(jù)信息和知識。 在關(guān)聯(lián)規(guī)則挖掘方法 中,有如下一些重要定義[16] 。
項集支持度是指數(shù)據(jù)項集在數(shù)據(jù)庫的所有記錄 中出現(xiàn)的頻率。 Support(X) = Num(X) ÷ N (1) 式中:X 表示數(shù)據(jù)項集;Num (X)表示項集 X 在 數(shù)據(jù)庫中出現(xiàn)的次數(shù);N 表示數(shù)據(jù)庫的總記錄次數(shù)。 對于數(shù)據(jù)庫中的某一條記錄,若其同時具有特 征屬性 X 與特征屬性 Y,則稱 X 和 Y 是關(guān)聯(lián)的,即構(gòu) 成一條關(guān)聯(lián)規(guī)則 X→Y。 關(guān)聯(lián)規(guī)則 X→Y 的支持度 計算: Support(X → Y) = P(XY) (2) 即在樣本數(shù)據(jù)中 X、Y 同時發(fā)生的頻率。 關(guān)聯(lián) 規(guī)則 X→Y 的置信度計算: Confidence(X → Y) = P(Y | X) (3) 即在樣本數(shù)據(jù)中 X 發(fā)生的前提下,Y 發(fā)生的頻 率。
關(guān)聯(lián)規(guī)則 X→Y 的提升度計算: Lift(X → Y) = P(Y | X) ÷ P(Y) (4) 即在樣本數(shù)據(jù)中兩種情況下頻率的比值。 關(guān)聯(lián) 規(guī)則挖掘算法中較為典型是 Apriori 算法,它的核心 思想是在確定支持度和置信度以及給定數(shù)據(jù)庫的前 提下,通過掃描數(shù)據(jù)庫中的數(shù)據(jù)記錄,從而挖掘出其 中滿足最小支持度閾值和最小置信度閾值的關(guān)聯(lián)規(guī) 則組合。 本研究采用 Python 軟件對社區(qū)居民數(shù)據(jù)集進(jìn) 行分析, 將最小支持度、 最小置信度分別設(shè)置為 0 01 和 0 05,得出該數(shù)據(jù)集的強(qiáng)關(guān)聯(lián)規(guī)則。 為了更 為直 觀 地 表 示 關(guān) 聯(lián) 關(guān) 系, 采 用 R3 6 1 軟 件 ( https: / / cran r⁃project org / )進(jìn)行可視化。
2 結(jié)果
原始數(shù)據(jù)集經(jīng)過清理和篩選后共確定 196 554 條居民記錄、101 個指標(biāo),其中老年人占半數(shù)以上。 在所有記錄中,100 211 人(51 0%) 至少患有高血 壓、冠心病或糖尿病之一,其中 95 473 人(48 6%)患高血壓,44 996 人( 22 9%) 患冠心病,39 936 人 (20 3%)患糖尿病,20 893 人( 10 6%)同時患有這 3 種慢病。 從性別和年齡看,女性高血壓、冠心病、 糖尿病的發(fā)生率( 50 4%、24 7%及 21 0%)均略高 于男性(46 4%、20 8%及 19 6%) ,老年人患病概率 高于非老年人(表 1) 。
2 1 肥胖程度與高血壓的關(guān)聯(lián)規(guī)則
列出部分單一先導(dǎo)或另包含肥胖程度的關(guān) 聯(lián)規(guī)則(支持度≥4%、提升度≥1 2) 。 在社區(qū)居民中超重人群高血壓的發(fā)生率達(dá) 56 1%, 71 9%的肥胖者患有高血壓,冠心病、糖尿病及其他 慢性病患者合并高血壓的情況非常突出。 超重或肥 胖使老年人、有飲食嗜好的人患高血壓的風(fēng)險明顯 提高(老年人:從 67 0%提高到 68 9%和 82 0%,有 飲食嗜好:從 60 2%提高到 69 1%和 78 8%) ,提示 老年人、有飲食偏好的人更應(yīng)注意控制體型,降低高 血壓的發(fā)病風(fēng)險。
2 2 肥胖程度與冠心病的關(guān)聯(lián)規(guī)則
列出包含有一個或兩個先導(dǎo)的部分關(guān)聯(lián)規(guī) 則(提升度≥1 0) 。 結(jié)果顯示,在社區(qū)居民中超重 者冠心病的發(fā)生率達(dá) 26 2%,32 8%的肥胖者患有 冠心病,高血壓、糖尿病及其他慢性病患者合并冠心 病的發(fā)生率高于其他狀態(tài)的人群;超重或肥胖使老 年人、有飲食嗜好的人、女性患冠心病的風(fēng)險有所提 高(老年人:從 34 4%提高到 35 1%和 41 5%,有飲食嗜好:從 31 5%提高到 35 7%和 40 9%,女性:從 24 7%提高到 29 8%和 37 6%) ,提示老年人、有飲 食偏好的人、女性更應(yīng)注意控制體型,降低冠心病的 發(fā)病風(fēng)險。
2 3 肥胖程度與糖尿病的關(guān)聯(lián)規(guī)則
列出部分與糖尿病有關(guān)的關(guān)聯(lián)規(guī)則(提升 度≥1 0) 。 結(jié)果顯示,在社區(qū)居民中超重者糖尿病 的發(fā)生率達(dá) 24 1%,30 2%的肥胖者患有糖尿病,冠 心病、高血壓及其他慢性病患者合并糖尿病較其他 情況人群更普遍;超重或肥胖使老年人、有飲食嗜好 的人、女性患糖尿病的風(fēng)險有所提高(老年人:從 28 7%提 高 到 30 4% 和 35 3%, 有 飲 食 嗜 好: 從 25 5%提高到 30 2%和 33 9%,女性:從 21 0%提高 到 26 3% 和 32 8%) ,提示老年人、有飲食偏好的 人、女性更應(yīng)注意控制體型, 降低糖尿病的發(fā)病風(fēng)險。
2 4 高血壓、冠心病、糖尿病的共同影響因素
體型因素及其他 單一先導(dǎo)影響因素的規(guī)則可視化結(jié)果。可見超重和肥胖均與高血壓、冠心病之間有較強(qiáng)的關(guān)聯(lián)性,而糖尿病與肥胖程度的關(guān)聯(lián)性較弱。老年、 飲食嗜好、女性與三種慢病都有關(guān)聯(lián),當(dāng)這些因素和超重、肥胖共同作用時,置信度和提升度都有顯著提高。
醫(yī)學(xué)論文投稿刊物:《中國慢性病預(yù)防與控制》報道內(nèi)容涉及慢性病預(yù)防與控制的戰(zhàn)略重點、戰(zhàn)略布局、戰(zhàn)略目標(biāo)和對策研究;各種慢性病的危險因素研究、發(fā)病機(jī)制的基礎(chǔ)實驗研究、臨床救治方法研究及救治經(jīng)驗;健康管理疾病管理的方法、效果評價方法的研究以及成本、效益分析;慢性病防治與社區(qū)衛(wèi)生服務(wù)相結(jié)合研究及其實踐經(jīng)驗;國內(nèi)外慢性病預(yù)防與控制的進(jìn)展和動態(tài)等。
3 討論與結(jié)論
本研究利用近 20 萬名社區(qū)居民健康大數(shù)據(jù),采用機(jī)器學(xué)習(xí)中的關(guān)聯(lián)規(guī)則技術(shù),分析了高血壓、冠心 病、糖尿病這 3 種常見慢性病之間以及與肥胖程度及其他人口學(xué)因素、生活習(xí)慣等的關(guān)聯(lián)性,展示了它們之間相互作用的強(qiáng)度。 從關(guān)聯(lián)規(guī)則得出的結(jié)果可 見,本研究涉及的 3 種慢性病相互之間且與體型等 因素之間均具有關(guān)聯(lián)性,其關(guān)聯(lián)性的強(qiáng)弱不等。
關(guān)聯(lián)規(guī)則可視化結(jié)果顯示,超重→高血壓、超重→冠心 病、肥胖→高血壓、肥胖→冠心病等均有較高的置信 度和提升度,高血壓、冠心病、糖尿病相互之間具有 關(guān)聯(lián)性并且有較高的置信度和提升度,可見這 3 種 慢性病不僅在人群中患病率高,常常伴隨發(fā)病,而且 這 3 種慢性病之間以及各自與其他疾病之間也存在 著很廣泛的關(guān)聯(lián),這與其他研究的結(jié)果一致[17-18] 。
從兩個先導(dǎo)的關(guān)聯(lián)規(guī)則中可以得出,冠心病患者超 重的情況下超重增加了高血壓的患病可能性,而當(dāng) 高血壓患者同時超重時超重會增加糖尿病的患病可 能性。 提示體型管理在高血壓、冠心病等慢性病防 治領(lǐng)域有重要作用,相對而言,肥胖與超重體型在慢 性病的防治中尤為重要。
本研究的數(shù)據(jù)分析結(jié)果顯示,女性高血壓、冠心 病、糖尿病的發(fā)生率均略高于男性,從國外相關(guān)研究 結(jié)果也提示了男性情況與女性情況的差異,如 Park 等[19]主題為韓國慢性病相關(guān)危險因素分析的研究 中,其監(jiān)測數(shù)據(jù)顯示:肥胖、吸煙并且不吃早餐的女 性出現(xiàn)睡眠不適的概率會更大,與慢性病有關(guān)聯(lián)性。 提示可以從更多方面和多角度的因素去分析由于性 別差異造成慢性病產(chǎn)生的原因和防治方法。 在年齡 方面,老年患者高血壓、冠心病、糖尿病的發(fā)生率均 高于非老年患者。
老年患者由于身體機(jī)能下降,新 陳代謝緩慢,抵抗力下降,更易于暴露在危險因素 下,而其身體屏障難以防御,各種疾病的發(fā)生率相較 青年而言都會有顯著提升,提示醫(yī)療工作者需要對 老年患者給予更多關(guān)心和愛護(hù),定期提供體檢服務(wù), 更好地預(yù)防和及早發(fā)現(xiàn)疾病發(fā)生。 提倡老年人進(jìn)行 適當(dāng)?shù)纳眢w鍛煉和擁有更健康的生活方式(如戒 煙[20]和改掉不良飲食嗜好) ,改善個人的身體機(jī)能, 從根本上預(yù)防與控制慢性病。 以上通過對高血壓、冠心病、糖尿病患者以體型 因素為主的關(guān)聯(lián)規(guī)則分析,提示患者和臨床醫(yī)生在 慢性病的初期就應(yīng)做好與其存在關(guān)聯(lián)性的疾病和危 險因素的篩查和預(yù)防工作,以免共患病和加重病情。 本文研究結(jié)果中所顯示的一些疾病和危險因素的關(guān) 聯(lián)性,使得相關(guān)疾病的預(yù)防更有針對性, 也更有效率。
參考文獻(xiàn)
[ 1 ] 陳大方. 慢性非傳染性疾病分子流行病學(xué)研究現(xiàn)狀與展望 [ J]. 中國慢性病預(yù)防與控制, 2016, 24(2) :81-83.
[ 2 ] Koroukian SM, Warner DF, Owusu C, et al. Multimorbidity redefined:prospective health outcomes and the cumulative effect of cooccurring conditions[ J]. Preventing Chronic Disease, 2015, 12:E55.
[ 3 ] Dunkler D, Kohl M, Teo KK, et al. Population⁃attributable fractions of modifiable lifestyle factors for CKD and mortality in individuals with type 2 diabetes: a cohort study [ J ]. American Journal of Kidney Diseases, 2016, 68(1) :29-40.
[ 4 ] Bahler C, Huber CA, Brüngger B, et al. Multimorbidity, health care utilization and costs in an elderly community⁃dwelling population: a claims data based observational study [ J ]. BMC Health Services Research, 2015, 15(1) :23.
作者: 陳晨1 王妮2 黃艷群2 周陽1 李盛俊1 陳卉2
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///yxlw/24615.html