[發明專利]一種深肌層浸潤數據預測方法及系統在審
| 申請號: | 202110487110.5 | 申請日: | 2021-05-04 |
| 公開(公告)號: | CN113178264A | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 林鳳;易新凱;唐震洲;周銘琰;黎瑋 | 申請(專利權)人: | 溫州醫科大學附屬第一醫院 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 溫州名創知識產權代理有限公司 33258 | 代理人: | 陳加利 |
| 地址: | 325000 *** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深肌層 浸潤 數據 預測 方法 系統 | ||
1.一種深肌層浸潤數據預測方法,其特征在于,包括以下步驟:
步驟S1、獲取深肌層浸潤數據集和深肌層非浸潤數據集來形成樣本數據,并將所獲取的樣本數據進行缺失值處理之后作為原始樣本數據;
步驟S2、取出所述原始樣本數據的特征值和預測值,并選擇預設的Borderline-Smote模型,對所述原始樣本數據進行不平衡數據處理;
步驟S3、將不平衡數據處理得到的樣本數據與所述原始樣本數據進行混合,得到一個新樣本數據集并進行歸一化處理,且進一步將歸一化處理的新樣本數據劃分成測試集和多個訓練集;
步驟S4、選取隨機森林的決策樹為CART類型,并分別訓練每一個劃分好的訓練集,得到每一個訓練集相對應的CART決策樹模型;
步驟S5、利用特征的重要性,對每一個CART決策樹模型中的所有特征均進行評估,得到每一個CART決策樹模型中滿足預定條件的特征集;
步驟S6、通過基尼指數的對比選出最優特征來對所有的CART決策樹模型中滿足所述預設條件的特征集進行分支處理,得到所有CART決策樹模型經過分支處理后的決策樹,并形成隨機森林;其中,將選出的最優特征按照基尼指數從大到小的順序進行剪枝排序,且所選的最優特征均是深肌層浸潤數據區別于深肌層非浸潤數據的關鍵特征;
步驟S7、獲取待測試數據集,將所述待測試數據集導入到訓練好的隨機森林模型中,區別出所述待測試數據集為深肌層浸潤數據集或深肌層非浸潤數據集。
2.如權利要求1所述的深肌層浸潤數據預測方法,其特征在于,在所述步驟S2中,所述選擇預設的Borderline-Smote模型,對所述原始樣本數據進行不平衡數據處理的具體步驟包括:
第一步、獲取整個數據集,記為訓練集T;其中,深肌層浸潤數據集記為P,深肌層非浸潤數據集記為N;其中,P={p1,p2,...ppnum},N={n1,n2,...,nnnum};pnum和nnum分別是深肌層浸潤數據集和深肌層非浸潤數據集各自對應的數量;
第二步、對于深肌層浸潤數據集P中的每一個樣本pi(i=1,2,...,pnum),計算出整個訓練集T中它的m個近鄰;其中,m個近鄰中深肌層非浸潤數據集N的個數用m′(0≤m′≤m)表示;
第三步、如果m′=m,則樣本pi被認為是噪聲;如果0≤m′≤m/2,則樣本pi被認為是安全數據集Tsafe;如果m/2≤m′≤m,則樣本pi被認為是錯誤類別樣本,并把樣本pi放到危險數據集Tdanger中;
第四步、設置危險數據集Tdanger且并對危險數據集Tdanger中的每個實例樣本p′i,均計算出對應深肌層浸潤數據集P中的k個近鄰;其中,Tdanger={p′1,p′2,...,p′dnum},且0≤dnum≤pnum;
第五步、對于每個實例樣本p′i,均隨機從深肌層浸潤數據集P中對應計算的k個近鄰中選出s個,并計算出每個實例樣本p′i和對應選出的s個近鄰的距離difj(j=1,2...,s),進一步用difj乘于一個介于0~1之間的隨機數rj,產生一個新的少數例樣本syntheticj;其中,syntheticj的計算公式為syntheticj=p′i+rj×difj(j=1,2,...s);
第六步,重復執行第四步和第五步;其中,對于每個實例樣本p′i,均得到s×dnum個新的少數例樣本synthetic。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于溫州醫科大學附屬第一醫院,未經溫州醫科大學附屬第一醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110487110.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于工件去毛刺的清潔裝置
- 下一篇:一種建筑電氣工程線管預留接頭模具
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





