[發明專利]一種針對CT影像的肺結節惡性度分級系統有效
| 申請號: | 202010021271.0 | 申請日: | 2020-01-09 |
| 公開(公告)號: | CN112365436B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 陳皓;段紅柏;郭紫園 | 申請(專利權)人: | 西安郵電大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06V10/80;G06V10/77;G06V10/774;G06N3/006;G06V10/82;G06N3/086;G16H50/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 710121 陜西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 ct 影像 結節 惡性 分級 系統 | ||
1.一種針對CT影像的肺結節惡性度分級系統,系統采用的方法:
步驟1:數據準備,具體為:
步驟1.1:肺內小結節影像提取,肺結節影像集合可表示為
G={G1,G2,...,GN},i=1,2,...,N,
其中,N為肺結節集合的總數,Gi為根據肺部CT影像病例集中的醫生對結節中心點的標注信息,上下左右分別加g個像素得到包含結節的矩形區域,可表示為Gi={x+g,x-g,y+g,y-g};
步驟1.2:劃分肺結節影像集合,根據醫生對每個結節標注的放射學語義征象和惡性度信息將肺結節影像集合G進行劃分,其結構可表示為
I={I1,I2,...,Irsn},n=1,2,...,rsn,
其中,I代表rsn種放射學語義征象集合,In為第n個放射學語義征象的肺結節圖像數據與征象評分的集合,Yin為In中肺結節影像Gi的評分,E為肺結節影像數據與惡性度評分的集合,yi為肺結節影像Gi惡性度對應的評分;
步驟2:放射學語義征象的特征提取,將I中的每個征象集合從影像組學和CNN兩個方面提取特征,具體為:
步驟2.1:影像組學特征提取,影像組學提取的特征集可表示為
其中,為第n個征象的影像組學特征集,的提取方式具體為:
步驟2.1.1:圖像預處理,對In中每個肺結節影像Gi通過自適應閾值以及形態組學膨脹操作得到分割后的影像Gi′;
步驟2.1.2:灰度特征提取,將每個肺結節影像Gi′通過灰度直方圖提取肺結節影像的最大值、最小值、均值、方差、偏度、峰度、直方圖熵、能量、標準差、中值、均方根11維統計特征,最終形成灰度特征集
步驟2.1.3:紋理特征提取,將每個肺結節影像Gi′采用灰度共生矩陣在(0,45,90,135)上提取紋理能量、最大概率、紋理熵、對比度、相關性、差異性、同質性、協方差、紋理均值和逆差分矩陣的均值40維特征,最終形成紋理特征集
步驟2.1.4:幾何形狀特征提取,將每個肺結節影像Gi′提取了粗糙度、直徑、橢圓的長短軸比例、離心率、周長、面積、緊湊度,矩形度7維特征,最終形成幾何特征集
步驟2.1.5:影像組學特征合并,將灰度、紋理、幾何特征集進行組合形成58維影像組學特征集,可表示為
步驟2.2:CNN高階特征提取,CNN提取的特征集可表示為
其中,為第n個征象的CNN特征集,的提取方式具體為:
步驟2.2.1:構建CNN模型,網絡結構為兩個卷積層,卷積核大小分別為32×3×3,64×3×3,兩個池化層,池化層大小分別為32×2×2,64×2×2,一個全連接層其大小為1×200,一個dropout層,設置丟棄率為0.5,一個softmax層;
步驟2.2.2:訓練CNN,對In的影像集采用70%的數據進行訓練,采用30%的數據進行測試,每次批量學習處理的影像個數為63,訓練迭代次數為1000,使用adam優化器將學習率設置為0.001,模型的準確率達到85%以上;
步驟2.2.3:提取CNN特征,將droput層和softmax層去掉,將In的影像集中的每個肺結節圖像Gi作為輸入通過該CNN的全連接層提取出200維特征,形成CNN特征集
步驟2.3:影像組學和CNN特征融合,融合后的特征集可表示為
其中,為第n個征象的融合特征集,其融合特征集的維度為258維,融合后的特征集可提高對肺結節信息的表達能力;
步驟2.4:特征選擇,根據特征重要性排名通過閾值α對特征總集FItotal中的每個征象特征集進行選擇,以減少特征集合中無用冗余的特征,選擇后的特征集可表示為
其中,表示第n個征象經過特征選擇后的特征,表示第n個征象中排名小于閾值α的特征;
步驟3:放射學語義征象的分類模型,rsn種放射學語義征象的分類模型可表示為
MI={MI1,MI2,...,MIrsn},n=1,2,...,rsn,
其中,MIn為第n個征象的分類模型,MIn的訓練方式具體為:
步驟3.1:數據準備,將特征集與In中的標簽Yn相對應,生成第n個征象的數據集,可表示為
步驟3.2:初始化種群,種群由NP個隨機生成的森林構成,可表示為
pop={RF1,RF2,....,RFNP},j=1,2,...,NP,
其中,NP為種群規模,RFj為tn個CART分類樹的組合,tn為可變參數;為了增加種群的多樣性,每次有放回的隨機采樣40%的DIn作為個體RFj初始化的數據集,置當前迭代數值gen=0;
步驟3.3:搜索運算,種群進化主要依靠交叉變異算子實現,按照交叉概率Pc和變異概率Pm選擇本次搜索為交叉或者變異操作,并轉到相應的搜索步驟,具體為:
步驟3.3.1:變異算子,變異運算定義為RF′=⊙RF,其中RF為從種群popgen中隨機挑選的個體,RF′為變異后的個體,⊙為變異運算符;由于個體的性能與每顆決策樹的性能以及決策樹之間組合的結構有很大關系,故采取2個層面的變異策略對個體進行變異;變異策略1為個體中樹層面的變異,首先從個體RF中隨機挑選兩顆樹,分別隨機選取兩棵樹的交換點,再交換以交換點為根節點的子樹,生成新的個體RF′;變異策略2為個體結構層面的變異,將從個體中增加樹和刪除樹兩個方面考慮,如果隨機數小于0.5,則向RF中添加一顆隨機生成的樹,否則將從RF中刪除一顆隨機被選擇的樹,然后生成新的個體RF′;按照概率Pms將2種不同的變異策略進行有效的結合,不僅對個體的組合結構進行搜索,還對個體中的樹進行搜索;
步驟3.3.2:交叉算子,交叉運算可定義為其中RF1和RF2為從種群popgen中隨機的挑選兩個個體,RF1′和RF2′為交叉后的個體,為交叉運算符;由于個體中樹的個數為可變大小,故交叉操作具體為:首先比較RF1和RF2中樹的個數tn1和tn2,從樹個數較多的RF1中無放回的隨機挑選出tn2個樹組成RF3,按照概率Pcg將RF3和RF2中對應位置的樹進行互換,生成新的個體RF3′和RF2′,將RF3′中的樹放回RF1中得到RF1′;
步驟3.4:選擇階段,首先對步驟3.3中產生的子代個體RF′與父代個體RF進個體進行評估,然后選擇性能較好的個體遺傳到下一代種群popgen+1中,具體為:
步驟3.4.1:個體評估,采用準確率作為個體評估方式,計算表達式如下
其中,TP表示實際為正被預測為正的樣本數量,FP表示實際為負但被預測為正的樣本數量,TN表示實際為負被預測為負的樣本數量,FN表示實際為正但被預測為負的樣本數量;
步驟3.4.2:個體選擇,對子代個體RF′與父代個體RF進行競爭,準確率高的個體加入到popgen+1中;
步驟3.5:若下一代種群popgen+1中個體數量小于種群規模NP,則轉步驟3.3,否則轉步驟3.6;
步驟3.6:更新全局最優個體,若全局最優個體Bbest為空時,則否則在Bbest和中根據步驟3.4選擇獲勝的個體更新全局最優個體,為種群popgen+1中準確率最高的個體,置gen=gen+1;
步驟3.7:判斷當前迭代次數gen是否達到最大迭代數值NG,若滿足輸出最優的個體Bbest作為第n個征象的分類器MIn,否則轉步驟3.3;
步驟4:惡性度分級識別模型,具體為:
步驟4.1:數據準備,將數據集E中的Gi圖像集通過步驟2和步驟3得到放射學語義征象的評分集Xi,將Xi與E中的標簽yi相對應,生成惡性度分級的數據集,可表示為
Xi={x1,x2,...,xrsn},
其中,Xi代表第i個肺結節圖片rsn種不同放射學語義征象的評分,yi為第i個肺結節圖片評分集Xi對應的惡性度級數;
步驟4.2:惡性度分級模型,采用softmax模型進行分級,模型可表示為
其中,W={w1,w2,...,wK}是一個[rsn,K]型矩陣,rsn為數據集ED特征維度,Xi為數據集中第i個樣本,K為惡性度級別;建立softmax模型后,采用差分進化算法對模型的參數W進行優化,差分進化算法優化的目標是最大化樣本惡性度分級準確的數量,目標函數可表示為
其中,Fi為樣本Xi經過softmax函數分級的結果是否正確,為ED中trn個樣本中分級結果準確的數量;在優化過程中將參數W轉成rsn×K維的行向量,在評價階段中將rsn×K維的行向量轉成[rsn,K]型矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安郵電大學,未經西安郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010021271.0/1.html,轉載請聲明來源鉆瓜專利網。





