[發明專利]一種面向深度學習模型訓練和學習的影像圖像數據擴充方法在審
| 申請號: | 201910028616.2 | 申請日: | 2019-01-11 |
| 公開(公告)號: | CN109767440A | 公開(公告)日: | 2019-05-17 |
| 發明(設計)人: | 徐軍;謝嘉偉;蔡程飛 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06K9/32;G06K9/62 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 戴朝榮 |
| 地址: | 210044 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據擴充 影像數據 訓練數據集 學習 模型訓練 影像圖像 計算機輔助診斷 計算技術領域 醫學圖像處理 醫學圖像數據 人工智能 概率預測 判斷數據 深度模型 圖像變換 網絡模型 醫學圖像 異常數據 腫瘤區域 異質性 準確率 構建 鑒別 診斷 計算機 | ||
本發明涉及一種面向深度學習模型訓練和學習的影像圖像數據擴充方法,屬于計算機醫學圖像計算技術領域。本發明首先判斷數據類型,鑒別CT或MRI圖像數據;然后對于影像數據,判斷是否有劃定ROI,并結合腫瘤區域大小,選用相應的方法完成影像數據集的構建;再采用基本的圖像變換法對影像數據集進行訓練,獲得初步訓練數據集;最后對初步訓練數據集進行數據擴充,再采用網絡模型進行深度訓練,最后進行概率預測。本發明基于人工智能的深度學習,將一系列數據擴充的方法應用在醫學圖像處理領域的深度模型訓練的學習上,解決由醫學圖像數據異質性而導致的異常數據的影響,有助于計算機輔助診斷,提高診斷效率和準確率。
技術領域
本發明涉及一種面向深度學習模型訓練和學習的影像圖像數據擴充方法,屬于計算機醫學圖像計算技術領域。
背景技術
在大數據時代一個高性能的深度模型往往需要大量的高質量數據,但高質量數據的獲取并不容易,因此這也意味著一個健壯(Robust)的模型并不容易獲得。其次,與自然圖像相比,醫學圖像數據的獲取往往更為困難,其根源來自病例數據獲取不易,同時數據的使用也存在一定的倫理和隱私限制,很難從實際角度上解決。例如,美國國立衛生研究院(NIH)在17年9月公布了胸部影像(CT)圖像數據集中共包含11萬張圖像數據,在去敏感信息的問題上,NIH團隊使用人機配合的模式一共篩查了七遍,其中包括最后純人工篩查的兩遍,臨時雇傭了14位醫學博士耗費數月時間,工作量非常大。在一定角度上,該情況加重了大數據模式在醫學診斷領域發展的困境。
由于影響數據量不足,影像圖像數據還常常具有很強的異質性(Heterogeneity)。由于數據集獲取困難,在圖像樣本數據不足的情況下,對于某種稀有病例往往只有極少量樣本可供予模型進行訓練、學習與測試,往往造成這種具有獨特影像特性的樣本數據在大量其他正、負樣本的“沖擊”下被當做異常數據。針對某些發病率較低且惡性程度通常較高的腫瘤的研究往往需要大批量的數據研究,樣本數量不足也會造成數據類別的不均衡,從而導致過擬合(Overfitting)。
此外,在許多情況下,計算機影像圖像處理模型從分子亞型的分類到各類診斷評級系統的搭建,在獲得出色的性能的同時都對高質量數據量有極高的要求。對于影像數據而言,例如影像科醫生往往會根據自身習慣對核磁共振機器的一部分參數進行調節以突出特定的組織,這就造成了同一臺機器不同時期的掃描結果也會有較大的差異。因此,通過數據擴充來實現影像圖像的主動領域適應是提高模型精度和性能的關鍵。由于影像圖像數據的特征信息往往更豐富也更隱秘,很多有價值的信息均屬于“亞視覺”特征,對于大量的如反色、超像素等方法,往往在醫學圖像領域的應用很局限,也需要在預測端進行數據擴充,以應對在模型應用時出現的一些非正常案例。
針對上述問題,目前有一些解決方法。如在網絡中加入類別正則化項,平衡過大或者過小的權重值來減少數據自身的不平衡性;也可在網絡搭建時采用棄權(Dropout)技巧,動態調整網絡基礎架構來避免過擬合現象。不過,現有方法在解決影像數據的異質性方面明顯不足,無法從根本上解決數據量不足的問題,不利于一些稀有病例的影像分析。本發明介紹的數據擴充是一種行之有效的策略,尤其適合于影像圖像數據的擴充。
發明內容
本發明要解決的技術問題是針對現有技術在解決影像數據異質性和分析稀有病例影像方面的不足,提出一種面向深度學習模型訓練和學習的影像圖像數據擴充方法,將系列數據擴充的方法應用于醫學圖像處理的深度模型訓練學習,有效地平衡地擴充數據集,通過數據迭代擴充,幫助醫生提高工作效率和疾病診斷的精準率,實現醫工結合的高效醫療和精準醫療。
為解決上述技術問題,本發明提供一種面向深度學習模型訓練和學習的影像圖像數據擴充方法,包括以下步驟:
(1)判斷數據類型,鑒別CT或MRI圖像數據;
(2)對于影像數據,判斷是否有劃定ROI,并結合腫瘤區域大小,選用相應的方法完成影像數據集的構建;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910028616.2/2.html,轉載請聲明來源鉆瓜專利網。





