[發(fā)明專利]針對圖像識別模型的增強訓練方法及裝置有效
| 申請?zhí)枺?/td> | 202011054451.5 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112101294B | 公開(公告)日: | 2022-08-09 |
| 發(fā)明(設計)人: | 徐文浩 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V40/40;G06T5/00;G06N3/04;G06N3/08;G06Q20/40;G06V10/82 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 圖像 識別 模型 增強 訓練 方法 裝置 | ||
本說明書實施例提供一種針對圖像識別模型的增強訓練方法,從第一樣本集中隨機選擇預定數(shù)量或預定比例的樣本作為種子樣本,進行擴展,得到若干擴展樣本。其中擴展樣本在原有圖像的基礎上添加擾動,而標注結果不變。樣本擴展過程中,擾動值以基準像素為參考,向四周呈預定分布,從而可以很好地模擬真實擾動。由于擴展樣本在添加擾動后標注結果不變,經過擴展樣本訓練的圖像識別模型可以很好地識別本來的圖像的目標識別結果,從而提高圖像識別模型的魯棒性。
技術領域
本說明書一個或多個實施例涉及計算機技術領域,尤其涉及圖像擾動處理、圖像樣本擴展以及利用擴展樣本對圖像識別模型進行增強訓練的方法及裝置。
背景技術
圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術。圖像識別廣泛應用于多種領域,例如無人駕駛、考勤、支付認證、刑偵追蹤等等。其中,在一些業(yè)務場景下,除了目標檢測,還需要識別相關目標是否真實目標實體,例如在人臉支付認證場景下,從用戶資金安全性考慮,為了避免使用人臉照片冒充真實的人進行支付,還需要確定人臉圖像是否為活體圖像。
這種情況下,如果圖像識別模型僅使用標準訓練樣本進行訓練,那么在增加圖像干擾的情況下,圖像識別結果的準確度可能會降低,造成一定的困擾,例如人臉支付認證業(yè)務場景下的資金安全性無法保證。因此,如何提高圖像識別模型的魯棒性,至關重要。
發(fā)明內容
本說明書一個或多個實施例描述了一種圖像擾動、擾動圖像樣本生成以及利用生成的擾動樣本對圖像識別模型的增強訓練方法及裝置,用以解決背景技術提到的一個或多個問題。
根據(jù)第一方面,提供一種針對圖像識別模型的增強訓練方法,包括:從第一樣本集中隨機選擇預定數(shù)量或預定比例的樣本作為種子樣本,其中,各個種子樣本分別對應有各個種子圖像以及針對相應種子圖像的標注結果;對各個種子樣本分別獲取基于擴展操作得到的若干擴展樣本,其中,對于單個種子樣本的擴展操作包括:對于所述單個種子樣本對應的單個種子圖像,至少在一個圖像通道上,對各個像素分別融合以基準像素為中心呈預定分布排列的各個擾動值,得到單個擾動圖像,其中,所述預定分布與各個像素到基準像素的距離相關;基于所述單個擾動圖像與所述單個種子樣本對應的標注結果構成單個擴展樣本,所述基準像素按照預定規(guī)則確定;基于所述擴展樣本對所述圖像識別模型進行增強訓練。
根據(jù)一個實施例,所述對于所述單個種子樣本對應的單個種子圖像,至少在一個圖像通道上,對各個像素分別融合以基準像素為中心呈預定分布排列的各個擾動值,得到單個擾動圖像,包括:構建與所述單個種子圖像像素排列一致的掩膜圖像;根據(jù)預定規(guī)則在所述掩膜圖像上確定對應于預定的基準擾動值且與所述基準像素對應的基準點;在所述掩膜圖像上,以所述基準點為中心,向周圍各個像素按照所述預定分布,生成由所述基準擾動值依次衰減或依次增強的各個擾動值,得到第一噪聲圖像;基于所述第一噪聲圖像向所述單個種子圖像的第一圖像通道的融合結果,得到第一擾動圖像。
根據(jù)一個實施例,所述預定分布為線性分布或正態(tài)分布。
根據(jù)一個實施例,所述第一噪聲圖像向所述單個種子圖像的第一圖像通道的疊加結果包括,根據(jù)預定權重,對所述第一噪聲圖像上的各個擾動值和所述第一圖像通道的各個圖像值,按照像素一一對應加權平均得到的結果。
根據(jù)一個實施例,所述第一擾動圖像中,還包括:所述第一噪聲圖像向所述單個種子圖像的第二圖像通道的疊加結果;或者,其它噪聲圖像向所述單個種子圖像的第二圖像通道的疊加結果。
根據(jù)一個實施例,所述單個種子圖像包括第一像素,所述第一像素與所述基準像素的距離為,以所在行和列為坐標,所述第一像素與所述基準像素的歐氏距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011054451.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





