[發明專利]數據處理方法及裝置在審
| 申請號: | 201811282706.6 | 申請日: | 2018-10-31 |
| 公開(公告)號: | CN109492684A | 公開(公告)日: | 2019-03-19 |
| 發明(設計)人: | 張彤宇 | 申請(專利權)人: | 西安同瑞恒達電子科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京挺立專利事務所(普通合伙) 11265 | 代理人: | 韓暢 |
| 地址: | 710000 陜西省西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像集合 樣本圖像 標注信息 數據處理 圖像標注 標注 模型建立過程 初始模型 人工標注 圖片集合 圖像識別 影響圖像 錯誤率 圖像 | ||
本公開提供一種數據處理方法及裝置,涉及數據處理方法及裝置,能夠解決圖像識別模型建立過程中,人工標注效率低、錯誤率高的問題,從而影響圖像識別模型的識別精度的問題。具體技術方案為:獲取第一圖像集合的標注信息,第一圖片集合包括至少一個樣本圖像,第一圖像集合中每一個樣本圖像對應一個標注信息;根據第一圖像集合的標注信息對圖像初始模型進行訓練,并得到圖像標注模型;將第二圖像集合中每一個樣本圖像通過圖像標注模型進行標注得到第二圖像集合的標注信息,第二圖像集合包括至少一個樣本圖像,第二圖像集合中每一個樣本圖像對應一個標注信息。本發明用于樣本圖像的標注。
技術領域
本公開涉及圖像處理技術領域,尤其涉及數據處理方法及裝置。
背景技術
在圖像分類和目標檢測等人工智能的圖像處理應用過程中,需要先建立圖像分類或者目標檢測的人工智能圖像處理模型,而模型的建立,需要用戶手動標注大量圖像來建立,然后根據建立的模型進行圖像分類或者目標檢測等操作。例如,尤其是目標檢測模型中,對圖像集進行標注的工作需要大量的人力以及極長的時間。這種標注方法極其耗時、耗力,而且,人工標注錯誤率較高,影響數據集質量。從而影響人工智能圖像處理應用的識別精度。
發明內容
本公開實施例提供一種數據處理方法及裝置,能夠解決圖像識別模型建立過程中,人工標注效率低、錯誤率高的問題。所述技術方案如下:
根據本公開實施例的第一方面,提供一種數據處理方法,該方法包括:
獲取第一圖像集合的標注信息,第一圖片集合包括至少一個樣本圖像,第一圖像集合中每一個樣本圖像對應一個標注信息;
根據第一圖像集合的標注信息對圖像初始模型進行訓練,并得到圖像標注模型;
將第二圖像集合中每一個樣本圖像通過圖像標注模型進行標注得到第二圖像集合的標注信息,第二圖像集合包括至少一個樣本圖像,第二圖像集合中每一個樣本圖像對應一個標注信息。
因為根據第一圖像集合的標注信息訓練得到了圖像標注模型,可以通過圖像標注模型自動標注第二圖像集合,減少人工標注的工作量,也降低了人工標注的錯誤率。
在一個實施例中,將第二圖像集合中每一個第二樣本圖像通過圖像標注模型進行標注得到第二圖像集合的標注信息,包括:
將第二個圖像集合中第m個樣本圖像通過圖像標注模型進行標注得到第m個樣本圖像的初始標注信息,m為大于0的整數;
獲取用戶輸入的第m個樣本圖像的糾正信息;
根據第m個樣本圖像的糾正信息和第m個樣本圖像的初始標注信息生成第m個樣本圖像的標注信息。
在一個實施例中,該方法還包括:
根據第二圖像集合的標注信息對圖像標注模型進行訓練,并得到圖像識別模型。
在一個實施例中,根據第一圖像集合的標注信息對圖像初始模型進行訓練,包括:
根據第一圖像集合的標注信息生成至少一個真實值;
將第一圖像集合中每一個樣本圖像通過圖像初始模型進行處理得到至少一個預測值;
根據至少一個預測值和至少一個真實值調整圖像初始模型的參數。
在一個實施例中,根據至少一個預測值和至少一個真實值調整圖像初始模型的參數,包括:
根據第一圖像集合中第n個樣本圖像的預測值對初始模型的參數進行調整,直到得到的第n個樣本圖像的預測值與第n個樣本圖像的真實值之間的差值在預設范圍內。
根據本公開實施例的第二方面,提供一種數據處理裝置,其特征在于,包括:獲取模塊、第一訓練模塊、標注模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安同瑞恒達電子科技有限公司,未經西安同瑞恒達電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811282706.6/2.html,轉載請聲明來源鉆瓜專利網。





