[發(fā)明專利]基于bagging算法的乳腺癌預(yù)測系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110203468.0 | 申請日: | 2021-02-23 |
| 公開(公告)號: | CN112927795B | 公開(公告)日: | 2022-09-23 |
| 發(fā)明(設(shè)計)人: | 余之剛;何勇;劉麗媛;考春雨;王斐;楊芙;范葉葉 | 申請(專利權(quán))人: | 山東大學(xué) |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H50/70 |
| 代理公司: | 濟南聯(lián)合竟成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 37371 | 代理人: | 田相迪 |
| 地址: | 250000 *** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 bagging 算法 乳腺癌 預(yù)測 系統(tǒng) | ||
1.基于bagging算法的乳腺癌預(yù)測系統(tǒng),其特征在于,包括處理單元,處理單元執(zhí)行以下步驟:
S1、病例-對照數(shù)據(jù)收集
基于乳腺癌防治相關(guān)知識設(shè)計調(diào)查問卷,問卷包含被認為對乳腺癌有影響的特征變量,通過該問卷收集來自中國三省一市122058名25-70歲女性的真實數(shù)據(jù),記錄病例-對照數(shù)據(jù)備份;
S2、數(shù)據(jù)處理
對問卷收集來的數(shù)據(jù)進行數(shù)據(jù)清洗,刪除重復(fù)信息以及缺失值或異常值過多的無效樣本和特征變量,選取合適的統(tǒng)一指標(biāo)填充其余缺失值,處理后的全部特征變量作為模型的輸入變量;
S3、簡單預(yù)測模型構(gòu)建
將步驟S2、數(shù)據(jù)處理中得到的樣本數(shù)據(jù)集劃分為樣本訓(xùn)練集和樣本驗證集;對于樣本訓(xùn)練集,通過bootstrap法采樣獲得T個采樣集,分別建立懲罰邏輯回歸乳腺癌預(yù)測模型,并分別對樣本驗證集進行預(yù)測;
S4、模型融合
在步驟S3、簡單預(yù)測模型構(gòu)建中,使用簡單平均法,對T個懲罰邏輯回歸乳腺癌預(yù)測模型得到的回歸結(jié)果進行算術(shù)平均作為最終模型輸出的乳腺癌預(yù)測概率,訓(xùn)練出最終預(yù)測模型;
S5、篩選重要特征變量
根據(jù)步驟S3、簡單預(yù)測模型構(gòu)建中的T個懲罰邏輯回歸乳腺癌預(yù)測模型得到的每個特征變量的回歸系數(shù),使用合適的方式給予每個特征變量一個得分,根據(jù)得分,篩選出對乳腺癌預(yù)測影響最大的幾個特征變量,來構(gòu)成特征子集,作為模型的又一輸入變量,重復(fù)步驟S3、S4,得到預(yù)測效果好且計算復(fù)雜度低的簡化模型;
S6、融合模型與其他經(jīng)典模型預(yù)測性能分析與對比
由步驟S2、數(shù)據(jù)處理中得到的樣本訓(xùn)練集訓(xùn)練其他經(jīng)典預(yù)測模型:Gail’s邏輯回歸模型、BCRAM,將步驟S4、模型融合中的預(yù)測結(jié)果與其他兩種經(jīng)典預(yù)測模型預(yù)測結(jié)果進行匯總,對AUC值進行比較,驗證融合模型的預(yù)測表現(xiàn)是否優(yōu)于其他模型;
所述步驟S4中,將得到的T個懲罰邏輯回歸乳腺癌預(yù)測模型進行融合,將模型數(shù)據(jù)參數(shù)進行調(diào)優(yōu),再得到最終預(yù)測效果最好的模型;
所述步驟S5中,依據(jù)T個懲罰邏輯回歸乳腺癌預(yù)測模型得到的每個特征變量的回歸系數(shù),得出每個特征變量作為篩選后變量的次數(shù)作為得分;并依據(jù)迭代次數(shù)和特征數(shù)目參數(shù)給定適當(dāng)閾值,得分高于閾值的特征作為重要特征變量;
所述步驟S6中,將T個懲罰邏輯回歸乳腺癌預(yù)測模型融合的模型和其他經(jīng)典模型的預(yù)測結(jié)果進行匯總,比較AUC值,驗證融合模型是否優(yōu)于其他經(jīng)典模型;
所述步驟S1中在問卷調(diào)查過程中,將被調(diào)查人員的包含到不同的年齡階段,且被調(diào)查人員不單單為女性,也可為男性。
2.根據(jù)權(quán)利要求1所述的基于bagging算法的乳腺癌預(yù)測系統(tǒng),其特征在于,所述步驟S2中將處理后的全部特征變量作為模型輸入變量前,將處理后的數(shù)據(jù)進行重新備份,備份后直接收錄在山東大學(xué)第二醫(yī)院乳腺癌外科專病數(shù)據(jù)庫內(nèi)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東大學(xué),未經(jīng)山東大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110203468.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 乳腺癌細胞MDA-MB-231的核酸適體LXL-2及其應(yīng)用
- 乳腺癌細胞MDA-MB-231的核酸適體LXL-3及其應(yīng)用
- 乳腺癌細胞MDA-MB-231的核酸適體LXL-1及其應(yīng)用
- 試劑在制備藥物中的用途以及篩選藥物的方法
- 一種乳腺癌干細胞特異性結(jié)合多肽及其在制備治療乳腺癌藥物中的應(yīng)用
- 乳腺癌分型基因群及其應(yīng)用
- 羥基紅花黃色素B在制備治療乳腺癌藥物中的應(yīng)用
- IL1R2在乳腺癌預(yù)后評估與靶向治療中的應(yīng)用
- 乳腺腫瘤組織中CICs在制備預(yù)測乳腺癌預(yù)后生存產(chǎn)品中的應(yīng)用
- 多模態(tài)多參數(shù)乳腺癌篩查系統(tǒng)、裝置及計算機存儲介質(zhì)





