[發明專利]一種深肌層浸潤數據預測方法及系統在審
| 申請號: | 202110487110.5 | 申請日: | 2021-05-04 |
| 公開(公告)號: | CN113178264A | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 林鳳;易新凱;唐震洲;周銘琰;黎瑋 | 申請(專利權)人: | 溫州醫科大學附屬第一醫院 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 溫州名創知識產權代理有限公司 33258 | 代理人: | 陳加利 |
| 地址: | 325000 *** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深肌層 浸潤 數據 預測 方法 系統 | ||
本發明提供一種深肌層浸潤數據預測方法,包括獲取深肌層浸潤數據集和深肌層非浸潤數據集形成為原始樣本數據;取出特征值和預測值,并選擇預設的Borderline?Smote模型,對原始樣本數據進行不平衡數據處理;將處理樣本數據與原始樣本數據混合并歸一化處理,劃分成測試集和多個訓練集;選取決策樹類型,訓練每一個訓練集對應的CART決策樹模型;對所有決策樹模型中特征評估,得到滿足預定條件的特征集;通過基尼指數的對比選出最優特征來進行分支處理決策樹,得到隨機森林;獲取待測試數據集導入訓練好的隨機森林模型中,區別出深肌層浸潤或非浸潤數據。實施本發明,能在分析預測過程中提高深肌層浸潤數據的占比,使得預測精度高且較易實現。
技術領域
本發明涉及計算機數據處理技術領域,尤其涉及一種深肌層浸潤數據預測方法及系統。
背景技術
肌層浸潤深度是多種腫瘤包括子宮內膜癌預后的獨立危險因素,同時也是評定臨床分期的重要參考因素。術前腫瘤肌層浸潤深度評估對于術后的治療策略包括放化療的選擇具有重要意義。此外,肌層浸潤還是影響預后的關鍵因素,在子宮內膜癌預后相關因素的分析中,深肌層浸潤的貢獻率相對其他因素較大。研究表明,子宮內膜癌患者中淋巴結受累與子宮肌層浸潤深度大于50%密切相關。子宮內膜癌伴有深肌層浸潤者,腹主動脈旁淋巴結轉移的發生率為21.1%,盆腔淋巴結轉移的發生率高達43.0%,深肌層浸潤患者較淺肌層浸潤患者病死率高出3.619倍。因此,對肌層浸潤相關影響因素的研究極具意義,不僅有助于術前分期的評判,還可對患者的預后進行預測。
深肌層浸潤情況是對深肌層浸潤數據進行深度分析預測所得,然而在分析預測過程中往往存在大量的深肌層非浸潤數據,極大的影響了數據預測的準確性。因此,有必要對深肌層浸潤數據進行準確的預測。
發明內容
本發明實施例所要解決的技術問題在于,提供一種深肌層浸潤數據預測方法及系統,能在分析預測過程中提高深肌層浸潤數據的占比,使得預測精度高且較易實現。
為了解決上述技術問題,本發明實施例提供了一種深肌層浸潤數據預測方法,包括以下步驟:
步驟S1、獲取深肌層浸潤數據集和深肌層非浸潤數據集來形成樣本數據,并將所獲取的樣本數據進行缺失值處理之后作為原始樣本數據;
步驟S2、取出所述原始樣本數據的特征值和預測值,并選擇預設的Borderline-Smote模型,對所述原始樣本數據進行不平衡數據處理;
步驟S3、將不平衡數據處理得到的樣本數據與所述原始樣本數據進行混合,得到一個新樣本數據集并進行歸一化處理,且進一步將歸一化處理的新樣本數據劃分成測試集和多個訓練集;
步驟S4、選取隨機森林的決策樹為CART類型,并分別訓練每一個劃分好的訓練集,得到每一個訓練集相對應的CART決策樹模型;
步驟S5、利用特征的重要性,對每一個CART決策樹模型中的所有特征均進行評估,得到每一個CART決策樹模型中滿足預定條件的特征集;
步驟S6、通過基尼指數的對比選出最優特征來對所有的CART決策樹模型中滿足所述預設條件的特征集進行分支處理,得到所有CART決策樹模型經過分支處理后的決策樹,并形成隨機森林;其中,將選出的最優特征按照基尼指數從大到小的順序進行剪枝排序,且所選的最優特征均是深肌層浸潤數據區別于深肌層非浸潤數據的關鍵特征;
步驟S7、獲取待測試數據集,將所述待測試數據集導入到訓練好的隨機森林模型中,區別出所述待測試數據集為深肌層浸潤數據集或深肌層非浸潤數據集。
其中,在所述步驟S2中,所述選擇預設的Borderline-Smote模型,對所述原始樣本數據進行不平衡數據處理的具體步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于溫州醫科大學附屬第一醫院,未經溫州醫科大學附屬第一醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110487110.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于工件去毛刺的清潔裝置
- 下一篇:一種建筑電氣工程線管預留接頭模具
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





