[發明專利]一種用于冠心病預診斷中的改進型隨機森林模型及其預診斷系統在審
| 申請號: | 202110488133.8 | 申請日: | 2021-05-06 |
| 公開(公告)號: | CN113128654A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 吳萬慶;蔣明哲;張獻斌 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06N3/00 | 分類號: | G06N3/00;G06N20/00;G16H50/20;G16H50/70 |
| 代理公司: | 深圳市創富知識產權代理有限公司 44367 | 代理人: | 高冰 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 冠心病 診斷 中的 改進型 隨機 森林 模型 及其 系統 | ||
1.一種用于冠心病預診斷中的改進型隨機森林模型,具有整體樣本,其特征在于,所述模型的建立了首先將所述整體樣本讀取至內存中,然后對所述整體樣本進行特征降維和特征選擇,再將篩選后的數據集作為分類器的輸入,通過設置12倍交叉驗證對訓練集進行訓練,獲得隨機森林模型的內部參數,所獲得參數設置于隨機森林模型中并對整體樣本進行訓練,至訓練結束后保存獲得用于冠心病預診斷中的改進型隨機森林模型。
2.根據權利要求1所述的用于冠心病預診斷中的改進型隨機森林模型,其特征在于,所述特征降維和特征選擇包括所處理的數據的類型是一致的,具有更好的歸一化性質;對所述數據進行分類,按照數據類型將數據分為數值類型特征和分類屬性的特征,即所有連續性屬性的特征作為一個特征集,所有分類屬性的數據作為另一個特征集;然后,特征選擇部分將所有連續性屬性的特征集、所有分類屬性的數據集分別放在篩選好的選擇器中進行計算,分別得到每個選擇器下的最優特征集1、最優特征集2;將最優特征集1、最優特征集2在投票模型中進行匯總,將得到票數作為閾值,其中,統計所有閾值≥4的特征形成最優特征集;統計最優特征集中所有元素的貢獻值;其次,統計訓練結果的評價指標,進行后續分析。
3.根據權利要求2所述的用于冠心病預診斷中的改進型隨機森林模型,其特征在于,特征選擇過程中分別使用了基于過濾法的皮爾遜相關系數,啟發式基于卡方分布的單變量特征選擇法;包裝器法中使用了基于線性回歸的遞歸特征消除法;嵌入法中的基于L1正則化的LASSO以及SelectFromModel。
4.根據權利要求1所述的用于冠心病預診斷中的改進型隨機森林模型,其特征在于,將篩選后的數據集作為整體樣本,然后將整體樣本按照80%和20%的比例進行劃分,分別形成訓練集和測試集。
5.根據權利要求1所述的用于冠心病預診斷中的改進型隨機森林模型,其特征在于,所述參數包括特征數量與流行的整數隨機種子,其中,所述特征數量為21個,所述流行的整數隨機種子42。
6.一種利用如權利要求所述的用于冠心病預診斷中的改進型隨機森林模型對冠心病進行預診斷的系統,其特征在于,所述系統包括直接輸入樣本集讀入內存中,然后作為輸入投進改進隨機森林模型,最后獲得分類結果。
7.根據權利要求6所述的用于冠心病預診斷中的改進型隨機森林模型對冠心病進行預診斷的系統,其特征在于,所述分類結果分為兩類,即冠心病高患病可能性以及冠心病低患病可能性,其中,所述改進隨機森林模型中“1”表示陽性,即冠心病高患病可能性,“0”表示陰性,即冠心病低患病可能性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110488133.8/1.html,轉載請聲明來源鉆瓜專利網。





