[發(fā)明專利]用于疾病預(yù)測的方法、裝置、計算機設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110396227.2 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113096817A | 公開(公告)日: | 2021-07-09 |
| 發(fā)明(設(shè)計)人: | 黃雨;秦源澤 | 申請(專利權(quán))人: | 北京大學(xué) |
| 主分類號: | G16H50/50 | 分類號: | G16H50/50;G16H50/70;G16H50/20 |
| 代理公司: | 北京華進京聯(lián)知識產(chǎn)權(quán)代理有限公司 11606 | 代理人: | 馬云超 |
| 地址: | 100089*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 疾病 預(yù)測 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
1.一種疾病預(yù)測模型的構(gòu)建方法,包括:
基于問卷,構(gòu)建數(shù)據(jù)集;
對所述數(shù)據(jù)集進行預(yù)處理;
使用多種集成方法,訓(xùn)練所述數(shù)據(jù)集;
基于評估指標(biāo),采用所述多種集成方法之一構(gòu)建所述疾病預(yù)測模型。
2.如權(quán)利要求1所述的方法,所述集成方法包括:
隨機采樣所述數(shù)據(jù)集以構(gòu)建訓(xùn)練子集;
針對所述訓(xùn)練子集,分別使用支持向量機算法、樸素貝葉斯算法、邏輯回歸算法,生成基學(xué)習(xí)器;
通過所述基學(xué)習(xí)器的預(yù)測概率的平均值,計算疾病的概率。
3.如權(quán)利要求1所述的方法,所述集成方法包括:
針對第一訓(xùn)練集,分別使用支持向量機算法、樸素貝葉斯算法,生成基學(xué)習(xí)器,其中,所述第一訓(xùn)練集是通過訓(xùn)練所述數(shù)據(jù)集獲取的;
通過所述基學(xué)習(xí)器,預(yù)測驗證集和第一測試集的概率標(biāo)簽;
獲取第二訓(xùn)練集和第二測試集;
通過邏輯回歸算法對第二訓(xùn)練集進行訓(xùn)練,獲取次級學(xué)習(xí)器,通過所述次級學(xué)習(xí)器,預(yù)測所述第二測試集;
通過與所述第一測試集的真實標(biāo)簽進行比較,計算疾病的概率。
4.如權(quán)利要求1所述的方法,所述評估指標(biāo)包括:
準(zhǔn)確率、敏感度和AUC,其中,AUC為接受者操作特性曲線與X軸之間的面積。
5.如權(quán)利要求1所述的方法,還包括優(yōu)化所述多種集成方法的參數(shù):
計算所述多種集成方法的參數(shù)的組合;
通過準(zhǔn)確率測試,選擇所述參數(shù);
其中,支持向量機的參數(shù)包括:
核函數(shù)類型kernal、核函數(shù)系數(shù)gamma和懲罰系數(shù)C,
邏輯回歸的參數(shù)包括:
正則化項penalty和正則化系數(shù)C。
6.如權(quán)利要求1所述的方法,所述構(gòu)建所述數(shù)據(jù)集包括:
刪除冗余特征。
7.如權(quán)利要求1所述的方法,所述對所述數(shù)據(jù)集進行預(yù)處理包括:
根據(jù)平均值或眾數(shù),計算缺失值。
8.如權(quán)利要求1所述的方法,所述對所述數(shù)據(jù)集進行預(yù)處理包括:
對所述數(shù)據(jù)集進行標(biāo)準(zhǔn)化。
9.一種基于機器學(xué)習(xí)的疾病預(yù)測方法,包括:
基于特征的值的范圍,從問卷獲取異常特征,并對所述異常特征進行預(yù)處理;將預(yù)處理后的異常特征輸入到通過權(quán)利要求1的方法構(gòu)建的模型中;
基于所述模型,計算異常特征對應(yīng)的疾病的概率。
10.如權(quán)利要求9所述的方法,還包括:
基于計算出的異常特征對應(yīng)的疾病的概率,輸出診斷結(jié)果。
11.一種基于機器學(xué)習(xí)的疾病預(yù)測裝置,所述裝置包括:
構(gòu)建模塊,用于基于問卷,構(gòu)建數(shù)據(jù)集;
預(yù)處理模塊,用于對所述數(shù)據(jù)集進行預(yù)處理;
訓(xùn)練模塊,用于使用多種集成方法,訓(xùn)練所述數(shù)據(jù)集;
選擇模塊,用于基于評估指標(biāo),采用所述多種集成方法之一構(gòu)建所述疾病預(yù)測模型。
12.一種計算機設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)權(quán)利要求1至8中任一項所述的方法的步驟。
13.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至8中任一項所述的方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué),未經(jīng)北京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110396227.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 疾病風(fēng)險預(yù)測方法以及執(zhí)行該方法的裝置
- 利用疾病與人體部位的映射進行疾病信息可視化的方法
- 疾病術(shù)語的詞處理方法、裝置及計算機設(shè)備
- 一種疾病名稱標(biāo)準(zhǔn)化規(guī)范數(shù)據(jù)庫及其建立方法
- 疾病預(yù)測方法、裝置、終端及存儲介質(zhì)
- 疾病風(fēng)險預(yù)測方法、裝置、計算機設(shè)備及計算機存儲介質(zhì)
- 疾病信息識別方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 疾病的層級關(guān)系處理方法、裝置及電子設(shè)備
- 一種基于復(fù)雜網(wǎng)絡(luò)的疾病進展路徑挖掘方法
- 知識圖譜的構(gòu)建和使用方法、裝置和介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





