[發明專利]一種基于聚焦融合的上下文學習醫學圖像分割方法在審
| 申請號: | 202011503406.3 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112529930A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 王如心;李燁 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G06T7/194 | 分類號: | G06T7/194;G06T7/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市誠輝律師事務所 11430 | 代理人: | 耿慧敏 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聚焦 融合 上下文 學習 醫學 圖像 分割 方法 | ||
本發明公開了一種基于聚焦融合的上下文學習醫學圖像分割方法。該方法包括以下步驟:對原始圖像數據進行預處理;將預處理的圖像數據輸入到經訓練的卷積神經網絡進行特征提取,其中所述卷積神經網絡的編碼網絡包含多個編碼階段并且每個編碼階段依次連接自動聚焦模塊和全景聚合模塊,所述卷積神經網絡的解碼網絡順序地解碼編碼階段的特征并生成對應的解碼特征,其中所述自動聚焦模塊用于同級編碼特征的多尺度上下文信息挖掘,所述全景聚合模塊用于聚合來自不同編碼階段的跨層級編碼特征。利用本發明能有效地編碼同級特征并實現了跨級特征的高效融合,從而顯著提升了圖像分割的精度。
技術領域
本發明涉及生物醫學工程技術領域,更具體地,涉及一種基于聚焦融合的上下文學習醫學圖像分割方法。
背景技術
隨著醫學影像學設備的快速發展和普及,成像技術包括磁共振成像(MR)、計算機斷層掃描(CT)、超聲、正電子發射斷層掃描(PET)等,成為醫療機構開展疾病診斷、手術計劃制定、預后評估、隨訪不可或缺的設備。醫學圖像處理是分析醫學圖像的首要步驟,有助于使圖像更加直觀、清晰,提高診斷效率,因此國內外都十分重視醫學影像處理。而圖像分割是圖像處理的重要環節,也是難點,精確的疾病檢測對于醫學診斷可以提供重要且可靠的參考價值。醫學圖像中病變區域往往表現出很高的類內差異性,以及類間的區分度不明顯等情況,同時一些噪聲也會干擾圖像質量。因此如何提取有效的上下文信息以及如何聚合不同水平的判別特征對于精細的分割圖像仍是一個很大的挑戰。
目前,隨著醫學圖像數量的增加以及人工智能(Artificial Intelligence,AI)技術的發展,計算機輔助診斷成為一種重要的手段,然而對于自動識別醫學影像中的感染區域,檢測圖像中的陰影和病變部分仍然是一項具有挑戰性的任務。其中高類間相似性和類內差異性是影響識別準確性的主要問題。例如對于肺部CT圖像,由于肺感染病變具有復雜的特征性表現如肺實變、毛玻璃樣混濁、雙側斑片狀陰影等多種異常,并且對于患者在不同時期的感染癥狀表現也明顯不同。此外,低對比度以及模糊的邊界進一步增加了圖像自動分割的難度。
最近,受益于卷積神經網絡(Convolutional Neural Network,CNN)的發展,許多傳統醫學圖像處理問題取得了重大突破,相比于傳統的人工特征,深度學習方法更有效地從圖像中提取高層語義特征。目前大多數的醫學圖像語義分割網絡遵循編解碼框架。通過這種結構,網絡可以挖掘出豐富的語義信息用于目標分割任務。例如,U-Net采用了跳躍連接來橋接編碼層和解碼層之間的同級信息,有效地補充了信息在編解碼過程中的損失,在解碼過程中取得了優異的性能。U-Net++使用了網狀的跳躍連接結構來集成功能不同的語義層次,提供了更好的分割性能。為了擴充特征表示并且保留精確的結構信息,條件隨機場(conditional random field,CRF),馬爾科夫隨機場(markov random field,MRF),空間金字塔池等技術被采用,例如PSPNet在編碼網絡中采用了多個金字塔池化獲取多尺度上下文信息。
一般情況下,編碼網絡從原始輸入圖像開始通過連續的多重卷積運算提取高水平語義特征表示。解碼網絡對編碼特征采用漸進上采樣(或反卷積)策略獲得最終分割結果。級聯卷積操作可以在編碼過程中有效地提取對象的高級語義信息,但同時它們也會導致對象邊界分割不夠準確。尤其是對于小病灶,由于重復CNN內部的池化操作,很多以CNN為基礎的模型未能保留足夠的空間細節和長程的上下文信息保持。此外,在每個階段對于編碼子網絡,模型需要響應因感染病灶大小不同而產生的類內差異性,具有單一尺度局部感受野的CNN網絡很難適應這種病變差異性很大的分割任務。
總之,現有技術的主要缺陷主要是:
1)傳統分析方法,在處理醫學圖像分割問題時,通常以特征點、邊緣檢測等為基礎進行分析,其缺點是易受成像對比度、噪聲以及一些人工效應的干擾,分析精度低。另外,傳統方法往往嚴格依賴設計的人工特征進行圖像編碼,對復雜場景的預測性能通常會受到極大的限制。
2)由于連續重復CNN內部的池化操作,很多以CNN為基礎的模型未能保留足夠的空間細節和長程的上下文信息保持。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011503406.3/2.html,轉載請聲明來源鉆瓜專利網。





