[發(fā)明專利]一種深肌層浸潤數(shù)據(jù)預(yù)測方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110487110.5 | 申請日: | 2021-05-04 |
| 公開(公告)號: | CN113178264A | 公開(公告)日: | 2021-07-27 |
| 發(fā)明(設(shè)計)人: | 林鳳;易新凱;唐震洲;周銘琰;黎瑋 | 申請(專利權(quán))人: | 溫州醫(yī)科大學(xué)附屬第一醫(yī)院 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 溫州名創(chuàng)知識產(chǎn)權(quán)代理有限公司 33258 | 代理人: | 陳加利 |
| 地址: | 325000 *** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 深肌層 浸潤 數(shù)據(jù) 預(yù)測 方法 系統(tǒng) | ||
1.一種深肌層浸潤數(shù)據(jù)預(yù)測方法,其特征在于,包括以下步驟:
步驟S1、獲取深肌層浸潤數(shù)據(jù)集和深肌層非浸潤數(shù)據(jù)集來形成樣本數(shù)據(jù),并將所獲取的樣本數(shù)據(jù)進行缺失值處理之后作為原始樣本數(shù)據(jù);
步驟S2、取出所述原始樣本數(shù)據(jù)的特征值和預(yù)測值,并選擇預(yù)設(shè)的Borderline-Smote模型,對所述原始樣本數(shù)據(jù)進行不平衡數(shù)據(jù)處理;
步驟S3、將不平衡數(shù)據(jù)處理得到的樣本數(shù)據(jù)與所述原始樣本數(shù)據(jù)進行混合,得到一個新樣本數(shù)據(jù)集并進行歸一化處理,且進一步將歸一化處理的新樣本數(shù)據(jù)劃分成測試集和多個訓(xùn)練集;
步驟S4、選取隨機森林的決策樹為CART類型,并分別訓(xùn)練每一個劃分好的訓(xùn)練集,得到每一個訓(xùn)練集相對應(yīng)的CART決策樹模型;
步驟S5、利用特征的重要性,對每一個CART決策樹模型中的所有特征均進行評估,得到每一個CART決策樹模型中滿足預(yù)定條件的特征集;
步驟S6、通過基尼指數(shù)的對比選出最優(yōu)特征來對所有的CART決策樹模型中滿足所述預(yù)設(shè)條件的特征集進行分支處理,得到所有CART決策樹模型經(jīng)過分支處理后的決策樹,并形成隨機森林;其中,將選出的最優(yōu)特征按照基尼指數(shù)從大到小的順序進行剪枝排序,且所選的最優(yōu)特征均是深肌層浸潤數(shù)據(jù)區(qū)別于深肌層非浸潤數(shù)據(jù)的關(guān)鍵特征;
步驟S7、獲取待測試數(shù)據(jù)集,將所述待測試數(shù)據(jù)集導(dǎo)入到訓(xùn)練好的隨機森林模型中,區(qū)別出所述待測試數(shù)據(jù)集為深肌層浸潤數(shù)據(jù)集或深肌層非浸潤數(shù)據(jù)集。
2.如權(quán)利要求1所述的深肌層浸潤數(shù)據(jù)預(yù)測方法,其特征在于,在所述步驟S2中,所述選擇預(yù)設(shè)的Borderline-Smote模型,對所述原始樣本數(shù)據(jù)進行不平衡數(shù)據(jù)處理的具體步驟包括:
第一步、獲取整個數(shù)據(jù)集,記為訓(xùn)練集T;其中,深肌層浸潤數(shù)據(jù)集記為P,深肌層非浸潤數(shù)據(jù)集記為N;其中,P={p1,p2,...ppnum},N={n1,n2,...,nnnum};pnum和nnum分別是深肌層浸潤數(shù)據(jù)集和深肌層非浸潤數(shù)據(jù)集各自對應(yīng)的數(shù)量;
第二步、對于深肌層浸潤數(shù)據(jù)集P中的每一個樣本pi(i=1,2,...,pnum),計算出整個訓(xùn)練集T中它的m個近鄰;其中,m個近鄰中深肌層非浸潤數(shù)據(jù)集N的個數(shù)用m′(0≤m′≤m)表示;
第三步、如果m′=m,則樣本pi被認為是噪聲;如果0≤m′≤m/2,則樣本pi被認為是安全數(shù)據(jù)集Tsafe;如果m/2≤m′≤m,則樣本pi被認為是錯誤類別樣本,并把樣本pi放到危險數(shù)據(jù)集Tdanger中;
第四步、設(shè)置危險數(shù)據(jù)集Tdanger且并對危險數(shù)據(jù)集Tdanger中的每個實例樣本p′i,均計算出對應(yīng)深肌層浸潤數(shù)據(jù)集P中的k個近鄰;其中,Tdanger={p′1,p′2,...,p′dnum},且0≤dnum≤pnum;
第五步、對于每個實例樣本p′i,均隨機從深肌層浸潤數(shù)據(jù)集P中對應(yīng)計算的k個近鄰中選出s個,并計算出每個實例樣本p′i和對應(yīng)選出的s個近鄰的距離difj(j=1,2...,s),進一步用difj乘于一個介于0~1之間的隨機數(shù)rj,產(chǎn)生一個新的少數(shù)例樣本syntheticj;其中,syntheticj的計算公式為syntheticj=p′i+rj×difj(j=1,2,...s);
第六步,重復(fù)執(zhí)行第四步和第五步;其中,對于每個實例樣本p′i,均得到s×dnum個新的少數(shù)例樣本synthetic。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于溫州醫(yī)科大學(xué)附屬第一醫(yī)院,未經(jīng)溫州醫(yī)科大學(xué)附屬第一醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110487110.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





