[發(fā)明專利]一種基于機(jī)器學(xué)習(xí)的2型糖尿病預(yù)測(cè)預(yù)警方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710665605.6 | 申請(qǐng)日: | 2017-08-07 |
| 公開(公告)號(hào): | CN107403072A | 公開(公告)日: | 2017-11-28 |
| 發(fā)明(設(shè)計(jì))人: | 楊勝齊;吳寒;丁夢(mèng);王冰笛 | 申請(qǐng)(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號(hào): | G06F19/00 | 分類號(hào): | G06F19/00 |
| 代理公司: | 北京思海天達(dá)知識(shí)產(chǎn)權(quán)代理有限公司11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機(jī)器 學(xué)習(xí) 糖尿病 預(yù)測(cè) 預(yù)警 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于機(jī)器學(xué)習(xí)預(yù)測(cè)分析與醫(yī)療健康技術(shù)領(lǐng)域,具體涉及一種基于機(jī)器學(xué)習(xí)的2型糖尿病預(yù)測(cè)預(yù)警方法。
背景技術(shù)
糖尿病是一種以高血糖為特征的慢性疾病,且具有明顯的家族遺傳特性,接近一半的糖尿病患者有家族遺傳病史。國(guó)際糖尿病聯(lián)盟在Diabetes Atlas(Seventh Edition)中的最新數(shù)據(jù)表明,2015年全世界范圍內(nèi)DM患病人群的數(shù)量將近4.15億。根據(jù)近年的增長(zhǎng)率預(yù)測(cè)到2040年,全球糖尿病患者將達(dá)到6.42億,這意味著未來(lái)每十個(gè)成年人中間就有一個(gè)人患有糖尿病。這一驚人的數(shù)字毫無(wú)疑問(wèn)需要引起高度重視。
近年來(lái),中國(guó)已成世界糖尿病患者第一大國(guó),目前患病人數(shù)已高達(dá)1.1億人,且患者數(shù)量還在不斷上升當(dāng)中。然而我國(guó)糖尿病患者知曉率僅為30.1%,其中僅有25.8%的患者得到治療,而在進(jìn)行治療的患者中,血糖得到良好控制的僅有39.7%,據(jù)此測(cè)算,糖尿病患者中,血糖得到控制的患者比例僅為3.08%。在城市和鄉(xiāng)村,上述數(shù)據(jù)存在顯著差異,且不同性別之間差異也較大,經(jīng)濟(jì)不發(fā)達(dá)地區(qū)的女性糖尿病的控制情況非常低。在這樣的情況下,通過(guò)先進(jìn)的技術(shù)手段做好糖尿病患病的前期預(yù)防和日常管理就顯得格外重要。
隨著人工智能機(jī)器學(xué)習(xí)等技術(shù)的快速發(fā)展,大量機(jī)器學(xué)習(xí)算法被運(yùn)用在醫(yī)療健康的方方面面。機(jī)器學(xué)習(xí)是研究如何使用機(jī)器來(lái)模擬人類學(xué)習(xí)活動(dòng)的學(xué)科。一種更為嚴(yán)格的定義是:機(jī)器學(xué)習(xí)是一門研究機(jī)器獲取新知識(shí)和新技能,并識(shí)別現(xiàn)有知識(shí)的學(xué)問(wèn)。機(jī)器學(xué)習(xí)主要研究的是讓機(jī)器從過(guò)去的經(jīng)歷中學(xué)習(xí)經(jīng)驗(yàn),對(duì)數(shù)據(jù)的不確定性進(jìn)行建模,并在未來(lái)進(jìn)行預(yù)測(cè)。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。
糖尿病預(yù)測(cè)預(yù)警是機(jī)器學(xué)習(xí)算法的應(yīng)用領(lǐng)域之一,主要在如下三個(gè)方面展開:1)重要糖尿病參數(shù)分析。通過(guò)主成分分析方法和關(guān)聯(lián)算法對(duì)多種糖尿病數(shù)據(jù)集的基本屬性值進(jìn)行分析篩選,得出引發(fā)糖尿病的重要因素;2)預(yù)測(cè)模型分析。通過(guò)多種分類算法對(duì)糖尿病數(shù)據(jù)集進(jìn)行有監(jiān)督的預(yù)測(cè)分析來(lái)判斷糖尿病風(fēng)險(xiǎn)參數(shù)在一定時(shí)間之后引發(fā)糖尿病的可能性,主要應(yīng)用的算法有決策樹算法、隨機(jī)森林算法、神經(jīng)網(wǎng)絡(luò)算法以及邏輯回歸算法等;3)預(yù)警分級(jí)分析。針對(duì)多種糖尿病數(shù)據(jù)集,通過(guò)無(wú)監(jiān)督的聚類算法,優(yōu)化現(xiàn)有糖尿病預(yù)警分級(jí)標(biāo)準(zhǔn)。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有糖尿病預(yù)測(cè)方法準(zhǔn)確性的不足,以及對(duì)潛在人群進(jìn)行風(fēng)險(xiǎn)提示的欠缺,提供了一種基于K-means算法、Logistic Regression算法和C4.5算法結(jié)合應(yīng)用的2型糖尿病預(yù)測(cè)預(yù)警方法。本方法對(duì)糖尿病參數(shù)進(jìn)行持續(xù)的數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)管理等工作,在此基礎(chǔ)之上形成預(yù)測(cè)分析、預(yù)警分級(jí)和日常管理等功能。
為達(dá)到上述目的,本發(fā)明采用的技術(shù)方案為:
一種基于機(jī)器學(xué)習(xí)的2型糖尿病預(yù)測(cè)預(yù)警方法,該方法通過(guò)K-means算法和Logistic Regression算法建立先聚類再分類的糖尿病雙層預(yù)測(cè)分析模型,對(duì)非糖尿病的分類結(jié)果通過(guò)C4.5算法和K-means算法分析出的規(guī)則進(jìn)行預(yù)警分級(jí),對(duì)糖尿病數(shù)據(jù)集通過(guò)日常數(shù)據(jù)收集管理后并進(jìn)行更新維護(hù)以優(yōu)化原始糖尿病雙層預(yù)測(cè)分析模型。本方法包括數(shù)據(jù)收集模塊、數(shù)據(jù)預(yù)處理模塊、預(yù)測(cè)分析模塊、預(yù)警分級(jí)模塊和日常管理模塊,數(shù)據(jù)收集模塊與數(shù)據(jù)預(yù)處理模塊連接,數(shù)據(jù)預(yù)處理模塊與預(yù)測(cè)分析模塊連接,預(yù)測(cè)分析模塊與預(yù)警分級(jí)模塊連接,預(yù)警分級(jí)模塊和日常管理模塊連接。
本方法包括以下步驟:
(1)基于現(xiàn)有的健康大數(shù)據(jù),獲取醫(yī)院、社康、體檢中心等醫(yī)療單位內(nèi)與糖尿病相關(guān)的健康數(shù)據(jù)以建立糖尿病參數(shù)數(shù)據(jù)庫(kù),健康數(shù)據(jù)包括年齡、身高、體重、腰圍、臀圍、收縮壓、舒張壓、心率、血糖、血氧、睡眠質(zhì)量和飲食習(xí)慣等。首先對(duì)每一個(gè)實(shí)例以糖尿病和非糖尿病進(jìn)行標(biāo)記。
(2)對(duì)糖尿病參數(shù)數(shù)據(jù)庫(kù)中的原始數(shù)據(jù)做數(shù)據(jù)預(yù)處理。預(yù)處理包括確定統(tǒng)一的數(shù)據(jù)項(xiàng)以及每一項(xiàng)的具體格式,具體格式為枚舉型或數(shù)值型等,然后通過(guò)數(shù)據(jù)清洗和數(shù)據(jù)標(biāo)準(zhǔn)化提高原始數(shù)據(jù)的質(zhì)量。
(3)使用K-means算法和Logistic Regression算法的雙層預(yù)測(cè)分析模型分析處理過(guò)的數(shù)據(jù)集,對(duì)每個(gè)實(shí)例屬于糖尿病或是非糖尿病進(jìn)行預(yù)測(cè)分類。
(4)使用C4.5算法和K-means算法結(jié)合的分析模型結(jié)合現(xiàn)有高危人群劃分標(biāo)準(zhǔn)對(duì)非糖尿病進(jìn)行預(yù)警分級(jí),提出無(wú)風(fēng)險(xiǎn)、低風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)三類標(biāo)識(shí)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710665605.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





