[發(fā)明專利]一種機器學習糖尿病視網(wǎng)膜病變發(fā)病風險預(yù)測方法及應(yīng)用在審
| 申請?zhí)枺?/td> | 202110232854.2 | 申請日: | 2021-03-03 |
| 公開(公告)號: | CN112786203A | 公開(公告)日: | 2021-05-11 |
| 發(fā)明(設(shè)計)人: | 房中則;劉永哲;高小茜;王婉瑩;李欣 | 申請(專利權(quán))人: | 天津醫(yī)科大學 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/70;G16H15/00;G06K9/62 |
| 代理公司: | 天津市杰盈專利代理有限公司 12207 | 代理人: | 朱紅星 |
| 地址: | 300070 *** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機器 學習 糖尿病 視網(wǎng)膜 病變 發(fā)病 風險 預(yù)測 方法 應(yīng)用 | ||
1.一種機器學習糖尿病視網(wǎng)膜病變發(fā)病風險預(yù)測方法,其特征在于包括數(shù)據(jù)獲取模塊、數(shù)據(jù)預(yù)處理模塊、機器學習模塊和顯示輸出模塊,其中:
(1)數(shù)據(jù)獲取模塊:連接醫(yī)院數(shù)據(jù)庫,用于獲取醫(yī)院數(shù)據(jù)庫中2型糖尿病患者的臨床病例數(shù)據(jù),每個臨床病例數(shù)據(jù)包括患者的代謝組學數(shù)據(jù)和對應(yīng)的臨床檢驗結(jié)果,其中,代謝組學數(shù)據(jù)應(yīng)包括氨基酸與氨基酸比值及肉堿與肉堿比值;
(2)數(shù)據(jù)預(yù)處理模塊:該模塊的輸入端與數(shù)據(jù)獲取模塊的輸出端連接,進行數(shù)據(jù)缺失值插補、抽樣、標準化和刪去近似零方差特征;
使用隨機森林模型進行數(shù)據(jù)缺失值插補;使用bootstrap進行數(shù)據(jù)抽樣,使樣本數(shù)據(jù)中糖尿病視網(wǎng)膜病變患者和非糖尿病視網(wǎng)膜病變患者數(shù)量相同;使用歸一化和離散化處理進行數(shù)據(jù)標準化,將患者的代謝組學數(shù)據(jù)的度量單位和格式進行統(tǒng)一;刪去近似零方差變量的目的是去除樣本數(shù)據(jù)中的不平衡變量,以得到穩(wěn)定理想的模型;
(3)機器學習模塊:輸入端與數(shù)據(jù)預(yù)處理模塊的輸出端連接,該模塊的結(jié)構(gòu)如下:
① 數(shù)據(jù)集劃分:使用bootstrap將樣本數(shù)據(jù)劃分為訓練集和測試集,劃分比例為2:1;
② 特征變量篩選:使用隨機森林進行特征變量篩選;
③ 構(gòu)建隨機森林模型和支持向量機模型:根據(jù)篩選后的變量構(gòu)建隨機森林模型和支持向量機模型,使用N折交叉驗證重抽樣進行參數(shù)調(diào)整,選擇最優(yōu)模型;
④ 內(nèi)部驗證:使用最優(yōu)隨機森林模型和支持向量機模型對測試集進行內(nèi)部驗證,使用曲線下面積、假陽性率、假陰性率和準確率評估模型的預(yù)測能力;
⑤ 外部驗證:基于獨立驗證集進行預(yù)測,并根據(jù)上述評估指標對模型的預(yù)測能力進行評估;
(4)顯示輸出模塊:將顯示輸出模塊的輸入端與機器學習模塊的輸出端連接,輸出模型的風險預(yù)測結(jié)果,其中,結(jié)果“1”表示存在糖尿病視網(wǎng)膜病變患病風險,結(jié)果“0”表示沒有糖尿病視網(wǎng)膜病變患病風險。
2.權(quán)利要求1所述機器學習糖尿病發(fā)病風險預(yù)測方法可用于非醫(yī)護人員進行疾病風險檢測或輔助臨床決策。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津醫(yī)科大學,未經(jīng)天津醫(yī)科大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110232854.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





