[發明專利]一種多數據模式環境下的數據增強方法、系統和存儲介質在審
| 申請號: | 201910854258.0 | 申請日: | 2019-09-10 |
| 公開(公告)號: | CN112560879A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 劉新;錢啟;劉帥普 | 申請(專利權)人: | 中科星圖股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/81 |
| 代理公司: | 北京華專卓海知識產權代理事務所(普通合伙) 11664 | 代理人: | 張繼鑫 |
| 地址: | 101399 北京市順義區臨空經濟核*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多數 模式 環境 數據 增強 方法 系統 存儲 介質 | ||
本發明提供一種多數據模式環境下的數據增強方法、系統和存儲介質,所述方法包括:對指定的輸入文件夾進行確認,所述輸入文件夾存有訓練用的原始樣本數據;待所述輸入文件夾確認完成后,創建指定的輸出文件夾;根據用戶所需處理的數據模態選擇對應的系統運行模式以及數據增強算法;根據所選的系統運行模式以及數據增強算法對所述輸入文件夾中的原始樣本數據進行數據增強處理,并生成對應的增強樣本數據;將所述原始樣本數據和所述增強樣本數據保存在所述輸出文件夾中。本發明針對目前數據增強算法較為散化的情況,通過集合增添多種系統運行模式及相應的數據增強算法,可快速完成對訓練樣本的多種數據增強處理操作,提高了工作效率。
技術領域
本發明涉及計算機視覺技術領域,尤其涉及一種多數據模式環境下的數據增強方法、系統和存儲介質。
背景技術
在人工智能的深度學習領域,各種網絡模型均是從海量的數據中獲取信息及模式。并且研究人員為了避免出現過擬合的問題,通常需要輸入充足的數據量。但在許多應用場景中,并不具備足夠的訓練樣本,例如醫學影像分析、遙感衛星圖像的地物檢測等。因而,數據增強在深度學習領域是不可或缺的一環。
數據增強也叫數據擴增,其目的是在非實質性的增加數據的情況下,讓有限的數據產生等價于更多數據的價值。具體地,數據增強可以分為:有監督的數據增強和無監督的數據增強方法。其中,有監督的數據增強又可分為單樣本數據增強和多樣本數據增強方法,無監督的數據增強分為生成新的數據和學習增強策略兩個方向。
通常的數據擴增指的是有監督數據增強的單樣本數據增強。簡單地說,有監督數據增強是在已有數據的基礎上,采用預設的數據變換規則,完成對數據的擴增。單樣本數據增強,即增強一個樣本的時候,全部圍繞著該樣本本身進行操作,包括幾何變換類,顏色變換類等。幾何變換類是對圖像進行幾何變換,包括翻轉,旋轉,裁剪,變形,縮放等各類操作。該類操作沒有改變圖像本身的內容,可能是選擇了圖像的一部分或者對像素進行了重分布。如果要改變圖像本身的內容,可選擇圖像的顏色變換類的數據增強,常見的包括噪聲、模糊、顏色變換、擦除、填充等。
目前,數據增強算法散化比較嚴重,很少有方法可以用于多種數據模式的處理。當對訓練樣本進行多種算法的數據擴增時,需要若干個腳本文件來實現。另外,處理不同研究領域的訓練樣本時,需要的算法更多,操作起來更復雜,時間消耗也更多。
發明內容
為了解決上述至少一個技術問題,本發明提出了一種多數據模式環境下的數據增強方法、系統和存儲介質。
為了實現上述目的,本發明第一方面提出了一種多數據模式環境下的數據增強方法,所述方法包括:
對指定的輸入文件夾進行確認,所述輸入文件夾存有訓練用的原始樣本數據;
待所述輸入文件夾確認完成后,創建指定的輸出文件夾;
根據用戶所需處理的數據模態選擇對應的系統運行模式以及數據增強算法;
根據所選的系統運行模式以及數據增強算法對所述輸入文件夾中的原始樣本數據進行數據增強處理,并生成對應的增強樣本數據;
將所述原始樣本數據和所述增強樣本數據保存在所述輸出文件夾中。
本方案中,在創建指定的輸出文件夾之后,所述方法還包括:
根據用戶所需處理的數據模態選擇目標檢測模式;
在所述目標檢測模式下,選擇對應的數據增強算法;
根據選擇的數據增強算法對包含原始圖像與其對應的XML文件的原始樣本數據進行增強處理,并生成包含增強圖像與其對應的XML文件的增強樣本數據。
本方案中,在創建指定的輸出文件夾之后,所述方法還包括:
根據用戶所需處理的數據模態選擇語義分割模式;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科星圖股份有限公司,未經中科星圖股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910854258.0/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





