[發明專利]面向多種CT肺部紋理識別的非監督保內容域適應方法有效
| 申請號: | 202010541959.1 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN111739076B | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 徐睿;葉昕辰;叢臻 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06T7/41 | 分類號: | G06T7/41;G06T7/00 |
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 陳玲玉 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 多種 ct 肺部 紋理 識別 監督 內容 適應 方法 | ||
1.面向多種CT肺部紋理識別的非監督保內容域適應方法,其特征在于,包括下列步驟:
1)訓練和測試數據準備:采集了兩組不同種類的CT圖像,并利用人工方式在這兩組CT圖像上標注典型肺部紋理區域;此后,隨機指定一組圖像為源域數據,另一組圖像為目標域數據;源域上的CT圖像和人工標注的肺部紋理區域,處理成帶標簽的CT小塊,用于在源域上監督訓練深層網絡模型;目標域的數據,處理成帶標簽和不帶標簽的CT小塊,其中不帶標簽的CT小塊,用于非監督方式對預先訓練深層網絡模型進行微調,帶標簽的CT小塊用于測試本發明所提技術方案的最終結果;
2)源域上識別網絡的構建和監督訓練:使用殘差網絡構建深層網絡模型,其結構包括編碼器和分類器兩部分;編碼器提取輸入CT肺部紋理圖像特征表示,分類器使用特征表示生成識別結果;使用源域中的帶標簽CT小塊,采用監督方式訓練該深層網絡,使網絡模型在源域的數據中達到良好的識別性能;
3)目標域上的深層模型微調:針對步驟2)中獲得的源域深層網絡模型,使用目標域的不帶標簽的CT小塊,利用基于對抗學習機制的損失函數進行非監督域適應,同時利用內容一致性模塊和內容一致性損失函數對目標域編碼器進行保持內容的約束,再結合源域中的監督分類訓練,再次利用源域中帶標簽的CT小塊,共同對目標域的深層模型進行微調,最終使深層網絡模型能在目標域保持良好的肺部紋理識別性能。
2.根據權利要求1所述的面向多種CT肺部紋理識別的非監督保內容域適應方法,其特征在于,步驟3)中的目標域上的深層模型微調,具體包括以下步驟:
3-1)為目標域數據構建一個與源域網絡模型結構相同的深層網絡,并使這兩個網絡的編碼器和分類器共享同樣的網絡參數權重,以步驟(2)中在源域數據中訓練得到的網絡模型的參數權重為初始值,進行目標域上的網絡模型微調;
3-2)使用對抗學習機制,構建判別器,通過優化對抗損失函數進行域適應,縮小源域和目標域編碼器特征表示域偏差;判別器由卷積模塊和全連接層組成,以源域和目標域編碼器特征表示為輸入,將源域編碼器特征表示判定為源域結果,標簽為1,將目標域編碼器特征表示判定為目標域結果,標簽為0;對抗損失函數公式如下:
式中,Ladv(·)表示對抗損失函數值,D表示判別器,f表示編碼器,表示數學期望,xs表示單次批量中參與訓練的源域CT圖像數據矩陣,xt表示單次批量中參與訓練的目標域CT圖像數據矩陣,Xs表示源域CT圖像矩陣集合,Xt表示目標域CT圖像矩陣集合,log(·)表示對數運算;
3-3)使用內容一致性模塊通過內容一致性損失函數約束目標域編碼器特征表示及輸入的目標域CT肺部紋理圖像,保持目標域內容一致性;內容一致性模塊包括卷積模塊和殘差模塊,將目標域編碼器特征表示重建為單通道圖像,與輸入目標域CT肺部紋理圖像通過L1范數約束;內容一致性損失函數公式如下:
式中,Lcp(·)表示內容一致性損失函數值,f表示編碼器,g表示內容一致性模塊,表示數學期望,xt表示單次批量中參與訓練的目標域CT圖像數據矩陣,Xt表示目標域CT圖像矩陣集合,‖·‖1表示L1范數;
3-4)使用目標域中不帶標簽的CT小塊,并再次使用源域中帶標簽的CT小塊,計算對抗損失函數、內容一致性損失函數和源域中的分類交叉熵損失函數的和,作為網絡微調的整體損失函數,具體公式如下:
Ltotal(f,h,g,D)=Ladv(D,f)+λcpLcp(f,g)+λtaskLtask(f,h)
式中,Ltotal(·)表示非監督保內容域適應的整體損失函數值,f表示編碼器,h表示分類器,g表示內容一致性模塊,D表示判別器,Ladv表示對抗損失函數值,λcp表示內容一致性損失函數系數,Lcp為內容一致性損失函數值,λtask表示分類交叉熵損失函數系數,Ltask表示分類交叉熵損失函數值;分類交叉熵損失函數的計算公式如下:
式中,Ltask(·)表示交叉熵損失函數值,f表示編碼器,h表示分類器,表示數學期望,xs表示單次批量中參與訓練的源域CT圖像數據矩陣,ys表示xs對應類別標簽矩陣,Xs表示源域CT圖像矩陣集合,Ys表示Xs對應類別標簽矩陣集合,∑表示求和運算符,K表示分類類別數,log(·)表示對數運算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010541959.1/1.html,轉載請聲明來源鉆瓜專利網。





