[發(fā)明專利]一種采用機器學習算法對乳腺癌進行良惡性特征統(tǒng)計的方法有效
| 申請?zhí)枺?/td> | 201910379311.6 | 申請日: | 2019-05-08 |
| 公開(公告)號: | CN110136108B | 公開(公告)日: | 2022-09-13 |
| 發(fā)明(設(shè)計)人: | 翟運開;趙杰;陳昊天;甘富文;石金銘;陳保站;盧耀恩;曹明波 | 申請(專利權(quán))人: | 鄭州大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/11;G16H30/20;G06V10/764 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務所(普通合伙) 32231 | 代理人: | 滕詣迪 |
| 地址: | 450000 河南省鄭*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 采用 機器 學習 算法 乳腺癌 進行 惡性 特征 統(tǒng)計 方法 | ||
1.一種采用機器學習算法對乳腺癌進行良惡性特征統(tǒng)計的方法,其特征在于:包括如下步驟:
步驟1:建立影像數(shù)據(jù)庫服務器、醫(yī)生客戶端服務器、第一輔助服務器和第二輔助服務器,影像數(shù)據(jù)庫服務器、醫(yī)生客戶端服務器、第一輔助服務器和第二輔助服務器之間均通過互聯(lián)網(wǎng)通信;
影像數(shù)據(jù)庫服務器用于存儲所有病人的乳腺MRI圖像;
步驟2:醫(yī)生通過醫(yī)生客戶端服務器讀取影像數(shù)據(jù)庫服務器中的病人的乳腺MRI圖像;
醫(yī)生在醫(yī)生客戶端服務器上對病人的乳腺MRI圖像進行腫瘤區(qū)域分割,醫(yī)生客戶端服務器將分割后的病人的乳腺MRI圖像保存為分割文件,并將分割文件傳送給數(shù)據(jù)庫服務器進行存儲;
數(shù)據(jù)庫服務器將分割文件和病人的乳腺MRI圖像歸類存儲在同一個文件夾中,生成病人數(shù)據(jù)包;
步驟3:重復執(zhí)行步驟2,直到影像數(shù)據(jù)庫服務器中存儲的所有病人的乳腺MRI圖像均生成分割文件,并生成病人數(shù)據(jù)包為止;
步驟4:第二輔助服務器調(diào)取影像數(shù)據(jù)庫服務器中所有的病人數(shù)據(jù)包作為訓練數(shù)據(jù),并進行特征提取、特征選擇和分類器訓練,進而得到分類器模型,其具體步驟如下:
步驟A1:每一個病人數(shù)據(jù)包中包含的乳腺MRI圖像均擁有2個序列,分別為T2W序列和T1C序列,T2W序列和T1C序列均包括數(shù)張圖片;
步驟A2:特征提取包括使用Pyradiomics2.1.2工具中的python包對分割文件進行腫瘤最大層面的2D特征提取,2D特征包括一階統(tǒng)計特征、2D形狀特征、灰度共生矩陣特征和灰度游程長度矩陣紋理特征;
同時對一階統(tǒng)計特征和灰度游程長度矩陣紋理特征進行小波變換;
步驟A3:特征選擇包括對所述2D特征進行Box-Cox變換,使得偏態(tài)分布更接近于正態(tài)分布;
對所述2D特征進行全局歸一化z-score標準化,生成數(shù)據(jù)集,經(jīng)過處理后的2D特征值均值為0,標準差為1;
采用Scikitlearn工具中的分層抽樣的方法對數(shù)據(jù)集進行劃分,分成訓練樣本和測試樣本,訓練集樣本為N例,測試集樣本為M例,N取值為正整數(shù),M取值為正整數(shù),指定一個用于保證試驗的可重復性的隨機數(shù)種子,隨機數(shù)種子的選取只是為了保證每次分層抽樣的結(jié)果不變,隨機數(shù)種子的取值數(shù)由用戶自由選?。?/p>
對訓練樣本和測試樣本的2D特征值進行曼-惠特尼U檢驗,選取p值小于0.10的特征;
在單參數(shù)情況下,使用曼-惠特尼U檢驗單獨評估每個2D特征值的預測值,在youden系數(shù)最大化時記錄每個2D特征值的AUC值;
使用最大相關(guān)最小冗余的特征選擇算法進行2D特征值的篩選,即,采用Survcomo程序包,將每個2D特征值得出的mRMR值按照由大到小的順序進行排序;
選取mRMR排名前30的2D特征值,通過基于AIC的后退法減少2D特征值,直到 最后剩余20個2D特征值;
步驟A4:分類器訓練包括分別對T1C序列、T2W序列和T1C序列+T2W序列進行訓練,使用SVM分類器進行模型訓練:
采用支持向量機訓練分類模型,得出最優(yōu)模型,分類決策函數(shù)為以下公式:
其中,k(x,y)=h(x)·h(y)為核函數(shù),用于將樣本數(shù)據(jù)映射到線性可分離的高維空間;
通過選擇合適的核函數(shù)k(x,y)和懲罰系數(shù),構(gòu)造并找到最優(yōu)解ai*,其中bi*的值通過任意一個支持向量求得;用四種核函數(shù)進行訓練,這四種核函數(shù)包括線性核函數(shù)Linear、多項式核函數(shù)Poly、徑向基核函數(shù)RBF和Sigmoid核函數(shù)Sigmoid,訓練模型在驗證數(shù)據(jù)集上進行驗證,最后選出效果最好的SVM模型,作為最優(yōu)模型;
步驟5:第二輔助服務器將最優(yōu)模型傳送給影像數(shù)據(jù)庫服務器進行存儲器;
步驟6:醫(yī)生通過醫(yī)生客戶端服務器將就診病人的MRI圖像輸入到影像數(shù)據(jù)庫服務器;
影像數(shù)據(jù)庫服務器根據(jù)步驟2的方法生成病人數(shù)據(jù)包;
第一輔助服務器從影像數(shù)據(jù)庫服務器中調(diào)取病人數(shù)據(jù)包,第一輔助服務器根據(jù)步驟A1到步驟A3的方法對病人數(shù)據(jù)包進行特征提取、特征選擇和分類器訓練,并調(diào)取第二輔助服務器所得出的最優(yōu)模型,進行腫瘤良惡性的數(shù)據(jù)統(tǒng)計,生成特征數(shù)據(jù)統(tǒng)計表;
步驟7:第一輔助服務器將特征數(shù)據(jù)統(tǒng)計表發(fā)送給醫(yī)生客戶端服務器并展示給醫(yī)生進行參考。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭州大學,未經(jīng)鄭州大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910379311.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





