[發明專利]一種基于圖像樣本的自動數據增強策略選擇方法在審
| 申請號: | 202011526140.4 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112651892A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 徐夢娟;姚鵬;申書偉;邵鵬飛 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/00;G06T7/90;G06T7/11;G06N3/04;G06N3/08 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 顧煒 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖像 樣本 自動 數據 增強 策略 選擇 方法 | ||
本發明提出一種基于圖像樣本的自動數據增強策略選擇方法,包括如下步驟:步驟1、獲取目標圖像數據集;步驟2、建立數據增強策略搜索空間,其中包括多種數據增強策略;步驟3、設定參數N值,對每一個圖像隨機進行N次圖像數據轉換操作,每次操作都均等的從所設立的搜索空間中選擇一種增強策略進行圖像變換操作;步驟4、設定參數P值,即單次增強策略有P的概率值會進行增強操作,也有1?P的概率保持圖像不變,若進行圖像變換,則變換幅度在設定變換量級范圍內隨機選擇;步驟5、在經過N次圖像變換后,以隨機裁剪的方式對經過圖像增強的數據進行剪裁,獲取輸入至神經網絡模型的圖像樣本;步驟6、將裁剪后的圖像數據輸入到深度神經網絡模型進一步訓練。
技術領域
本發明涉及圖像處理領域,特別是醫學圖像數據增強策略方法領域。
背景技術
1)隨著圖像處理技術特別是深度學習技術的快速發展,在很多方面需要用到大量的有標記數據,比如人臉識別、醫學影像相關疾病的自動診斷等,而獲取充足的標記數據是一份非常耗時耗力的工作。數據增強是一種有效的解決標注數據不足的一種方法,它能夠利用現有的標注數據,通過一系列圖像轉換操作,生成新的數據,從而有效的擴充數據集。
2)近年來,在大量的圖像處理,以及醫學影像處理任務中,通常使用深度神經網絡技術來提取圖像的特征,可以取得更高的性能。但是,為了保證深度神經網絡模型的性能,通常需要大量的有標注樣本進行訓練,然而大量樣本的獲取是非常不容易的,特別是對于某些醫學病例的樣本,往往多年的積累也才累計到幾千甚至幾百例樣本。同時對樣本的標注也是非常耗時耗力的,比如要對一幅醫學圖像中的病灶進行精確的邊緣分割標注,一個人往往需要幾分鐘甚至是十幾分鐘的時間。當需要的標注圖像數較大時(比如10000幅),則需要大量的時間,從而使得獲取有標注數據變得代價異常昂貴。由于圖像數據采集工作量巨大,且人工標注耗時耗力,故在許多醫學圖像處理任務時,常使用數據增強技術。數據增強技術是一種較好的降低采集成本的方法,可以有效的擴展訓練樣本數,提高深度神經網絡模型的識別準確率,使其有更好的泛化能力和魯棒性。
3)目前常見的圖像數據增強方法主要分為兩種,分別為手工設計增強策略和自動增強策略。手工設計的數據增強方法通常需要豐富的專家經驗,且這種方式設計出的策略通常難以達到最優的性能,因此現有工作已經提出了一些自動化的數據增強技術來緩解這個問題,例如,通過生成對抗網絡生成新數據;創建通用的數據增強策略搜索空間,并在不同的通用數據集上搜索得到最佳的數據增強策略集合,如AutoAugment、RandAugment等;
4)數據增強是克服訓練數據樣本有限這一挑戰的關鍵方法之一,數據增強可以擴展數據的多樣性,能夠充分提取原始圖像數據的特征。當前自動增強策略相對于手工設計的增強策略,通常有更好的效果,但是自動搜索過程一般非常耗時,并且需要大量的計算資源,在很大程度上降低了數據增強方法的使用效率。
發明內容
為了解決上述技術問題,本發明旨在提出一種基于圖像樣本的自動數據增強策略選擇方法,提高了圖像數據的可利用性,能夠更充分提取數據特征,從而盡可能降低標注數據不足的缺陷,擴大圖像數據的多樣性。通過此圖像增強策略與深度學習技術相結合,可提高模型的識別準確性,同時該數據增強方法可以進一步推廣應用至大量的醫學圖像處理任務中,特別是提升深度學習神經網絡模型的識別準確率。
本發明的技術方案如下:
一種基于圖像樣本的自動數據增強策略選擇方法,包括如下步驟:
步驟1、獲取目標圖像數據集;
步驟2、建立數據增強策略搜索空間,所述搜索空間包括多種數據增強策略,同時設立每種增強策略的量級取值范圍;
步驟3、設定參數N值,其中N值表示對每一個圖像隨機進行N次圖像數據轉換操作,每次操作都均等的從所設立的搜索空間中選擇一種增強策略進行圖像變換操作;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011526140.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高濃度有機廢水處理方法及裝置
- 下一篇:一種新型超聲復合鼓泡反應器
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





