[發(fā)明專利]一種基于CNN和模型融合的糖尿病血糖預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201811079861.8 | 申請(qǐng)日: | 2018-09-17 |
| 公開(公告)號(hào): | CN109448855A | 公開(公告)日: | 2019-03-08 |
| 發(fā)明(設(shè)計(jì))人: | 車超;趙撼宇 | 申請(qǐng)(專利權(quán))人: | 大連大學(xué) |
| 主分類號(hào): | G16H50/50 | 分類號(hào): | G16H50/50;G16H50/20;G06N3/04 |
| 代理公司: | 大連八方知識(shí)產(chǎn)權(quán)代理有限公司 21226 | 代理人: | 衛(wèi)茂才 |
| 地址: | 116622 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 糖尿病血糖 模型融合 預(yù)測(cè) 預(yù)處理 穩(wěn)健性 定量特征 數(shù)據(jù)轉(zhuǎn)換 特征提取 傳統(tǒng)的 第一層 二值化 血糖 空缺 分類 統(tǒng)一 | ||
本發(fā)明涉及一種基于CNN和模型融合的糖尿病血糖預(yù)測(cè)方法。包括以下步驟:首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括空缺值的處理、定量特征的二值化和數(shù)據(jù)轉(zhuǎn)換。其次,利用CNN對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行特征提取。最后利用Stacking策略對(duì)xgboost、catboost和linearRegression進(jìn)行模型融合,在第一層采用了分類精度較高的catboost、xgboost模型,第二層模型采用了穩(wěn)健性較好的linearRegression,實(shí)現(xiàn)了預(yù)測(cè)精度和模型穩(wěn)健性的統(tǒng)一,具有更強(qiáng)的泛化能力。本發(fā)明有效的解決了糖尿病血糖的預(yù)測(cè)問題,相較于傳統(tǒng)的血糖預(yù)測(cè)方法有了顯著的提高。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器學(xué)習(xí)領(lǐng)域,具體涉及用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行特征提取和利用模型融合技術(shù)對(duì)血糖進(jìn)行預(yù)測(cè)。
背景技術(shù)
近年來,糖尿病的患病率在世界范圍內(nèi)呈上升趨勢(shì),已成為目前繼腫瘤和心腦血管疾病之后第三位威脅人類健康的重大非傳染性疾病。目前糖尿病無法根治,只能通過科學(xué)有效的預(yù)防降低發(fā)病率。由于血糖濃度往往與人的其他體檢指標(biāo)存在某種內(nèi)在的聯(lián)系,因此,利用機(jī)器學(xué)習(xí)技術(shù)依據(jù)其他體檢指標(biāo),建立血糖濃度預(yù)測(cè)模型準(zhǔn)確評(píng)估人們的患病風(fēng)險(xiǎn),進(jìn)而對(duì)高危個(gè)體進(jìn)行干預(yù),有助于實(shí)現(xiàn)疾病的有效預(yù)防。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)和模型融合的糖尿病血糖預(yù)測(cè)方法,該方法是通過分析體檢數(shù)據(jù)中各項(xiàng)指標(biāo),預(yù)測(cè)病人的血糖濃度,評(píng)估人們的患病風(fēng)險(xiǎn),進(jìn)而對(duì)高危個(gè)體進(jìn)行預(yù)警,有助于實(shí)現(xiàn)糖尿病的預(yù)防。具體的步驟包括:
S1:對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括空缺值的處理、定量特征的二值化和數(shù)據(jù)轉(zhuǎn)換;
S2:利用CNN對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行特征提取;
S3:利用Stacking策略對(duì)xgboost、catboost和linearRegression進(jìn)行模型融合。
進(jìn)一步地,S1所述的數(shù)據(jù)預(yù)處理具體包括:(1)空缺值的處理:對(duì)于存在數(shù)據(jù)大量缺失現(xiàn)象的屬性,對(duì)于這些屬性本發(fā)明發(fā)不予考慮;對(duì)于存在少量數(shù)據(jù)缺失現(xiàn)象的屬性,采取均值法對(duì)缺失的數(shù)據(jù)進(jìn)行補(bǔ)全處理;(2)定量特征二值化:對(duì)非數(shù)值型數(shù)據(jù)進(jìn)行One Hot編碼,將非數(shù)值數(shù)據(jù)轉(zhuǎn)換為數(shù)值型數(shù)據(jù);(3)數(shù)據(jù)轉(zhuǎn)換:對(duì)處理后的數(shù)據(jù)做log1P變換。
進(jìn)一步地,S2所述的利用CNN對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行特征提取具體包括:所述CNN共包含6層:2個(gè)卷積層,2個(gè)池化層和一個(gè)全連接層,其中:(1)第一個(gè)卷積層由64個(gè)卷積核構(gòu)成,卷積核大小為1*5;第二個(gè)卷積層由32個(gè)卷積核構(gòu)成,卷積核大小為1*3;(2)2個(gè)池化層分別緊跟在第一個(gè)和第二個(gè)卷積層的后面,窗口大小均為2,用于實(shí)現(xiàn)對(duì)時(shí)域1D信號(hào)進(jìn)行最大值池化;(3)最后一層是全連接層,該層中26個(gè)Batch-Normalized的輸出將作為新特征用于特征矩陣的構(gòu)建。
在迭代過程中,使用均方差作為損失函數(shù),采用Adam優(yōu)化器對(duì)影響模型訓(xùn)練和模型輸出的網(wǎng)絡(luò)參數(shù)進(jìn)行更新。
進(jìn)一步地,S3所述的利用Stacking策略對(duì)xgboost、catboost和linearRegression進(jìn)行模型融合具體包括;選取catboost、xgboost作為1層的回歸模型,選擇linearRegression作為第二層的回歸模型,在第一層模型訓(xùn)練時(shí),先把訓(xùn)練集分為5份,依次用其中的4份進(jìn)行訓(xùn)練,1份用來驗(yàn)證,經(jīng)過5次訓(xùn)練后,將驗(yàn)證集的預(yù)測(cè)結(jié)果拼接起來,作為第二層訓(xùn)練集的特征,同時(shí),對(duì)測(cè)試集的預(yù)測(cè)結(jié)果取平均,作為第二層測(cè)試集的特征,最后在第二層運(yùn)用linearRegression模型對(duì)第一層輸出的特征進(jìn)行回歸預(yù)測(cè)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連大學(xué),未經(jīng)大連大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811079861.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 糖尿病監(jiān)測(cè)儀
- 丹酚酸A在預(yù)防和\或治療糖尿病及并發(fā)癥中的應(yīng)用
- 降糖黑芝麻粉
- 抗栓再造丸藥物組合物及其在治療Ⅱ型糖尿病中的應(yīng)用
- 一種槐花珍在制備治療高血糖和糖尿病藥物中的應(yīng)用
- 一種用于緩解糖尿病引起的血糖升高以及預(yù)防和治療糖尿病的中藥組合物及其用途
- 一種降低空腹血糖及餐后血糖的沙棘葉五味丸及制備方法
- 短勝肽、及其組合物用于治療/預(yù)防糖尿病及與之相關(guān)疾病的用途
- 一種糖尿病并發(fā)癥風(fēng)險(xiǎn)早期檢測(cè)管理系統(tǒng)及方法
- 基于外科康復(fù)理念的糖尿病圍手術(shù)期患者血糖管理信息系統(tǒng)
- 電氣設(shè)備仿真模型融合方法及融合系統(tǒng)
- 基于深度學(xué)習(xí)的多級(jí)融合文檔分類方法和系統(tǒng)
- 一種機(jī)器學(xué)習(xí)模型的動(dòng)態(tài)融合方法及裝置
- 一種基于骨重建原理的個(gè)性化前路椎間融合器設(shè)計(jì)方法
- 一種選擇融合模型權(quán)重參數(shù)的方法、裝置及設(shè)備
- 基于權(quán)重嫁接的模型融合的人臉識(shí)別方法及相關(guān)設(shè)備
- 數(shù)字化模型融合方法及裝置
- 多模型融合訓(xùn)練方法、文本分類方法以及裝置
- 基于模型融合的件量預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 支持混合模型融合的Model Ensemble方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 電鍍預(yù)處理溶液和電鍍預(yù)處理方法
- 鐵水預(yù)處理方法及其預(yù)處理裝置
- 預(yù)處理裝置及其預(yù)處理方法
- 預(yù)處理組件、使用該預(yù)處理組件進(jìn)行試樣的預(yù)處理的預(yù)處理裝置及包括該預(yù)處理裝置的分析系統(tǒng)
- 待測(cè)樣品預(yù)處理裝置、預(yù)處理筒及預(yù)處理方法
- 醋酸纖維卷曲預(yù)處理裝置、預(yù)處理液及預(yù)處理方法
- 預(yù)處理裝置
- 預(yù)處理濾芯
- 甘薯儲(chǔ)藏預(yù)處理設(shè)備及預(yù)處理方法
- 水樣預(yù)處理裝置、水樣預(yù)處理系統(tǒng)及水樣預(yù)處理方法





