[發明專利]一種跨域網絡訓練及圖像識別方法在審
| 申請號: | 201811500433.8 | 申請日: | 2018-12-07 |
| 公開(公告)號: | CN111291780A | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 劉若鵬;欒琳;趙盟盟 | 申請(專利權)人: | 深圳光啟空間技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518000 廣東省深圳市龍崗區坂田街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 訓練 圖像 識別 方法 | ||
本發明涉及一種跨域網絡訓練及圖像識別方法,該跨域網絡訓練包括:S1,向深度神經網絡輸入第一域和第二域的樣本數據,對所述第一域和第二域的樣本數據進行訓練,使得在所述深度神經網絡在第一域與第二域上各自具有分類能力;S2:消除域間統計分布差異,使得第一域和第二域具有相近的統計分布特性;S3:對第一域和第二域進行加強內聚集的訓練;S4:對符合預設條件的訓練結果進行保存。實施本發明,即使在數據具有不同統計分布特性的情況下,也能夠正確的識別出來。
技術領域
本發明涉及人工智能領域,具體的,涉及一種跨域網絡訓練及圖像識別方法。
背景技術
人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術,通常也叫做人像識別、面部識別。
現有人臉識別算法大多可以解決單域人臉識別(即待識別圖像和訓練樣本圖像具有相同的統計分布特性)問題,例如,使用視頻作為訓練樣本,然后對訓練好的網絡識別其他視頻中的人臉。Florian Schroff等人提出的Facenet算法是目前效果較好的單域人臉識別算法,同時作者也給出了相應的單域數據訓練方法。
但在實際應用場最下,監控攝像頭拍攝視頻中提取出的人臉照片具有十分復雜的光照、角度、分辨率和表情等變化因素,這使得待識別圖像與訓練樣本圖像具有差異巨大的統計分布特性,即跨域識別問題。目前的人工智能網絡很難對跨域的圖像實現準確的識別。
發明內容
本發明的目的在于,針對現有的圖像識別方法無法對跨域的場景實現準確的識別的缺陷,提供一種新的跨域圖像識別方法,以克服目前的圖像識別技術在跨域識別的場最中準確性差的問題。
本發明的一個方面提供一種跨域網絡訓練方法,包括以下步驟:
S1:向深度神經網絡輸入第一域和第二域的樣本數據,對第一域和第二域的樣本數據進行訓練,使得在深度神經網絡在第一域與第二域上各自具有分類能力;
S2:消除域間統計分布差異,使得第一域和第二域具有相近的統計分布特性;
S3:對第一域和第二域進行加強內聚集的訓練;
S4:對符合預設條件的訓練結果進行保存。
較佳的,步驟S1中對第一域和第二域的樣本數據進行訓練包括:對第一域和第二域的樣本數據進行損失函數Triplet-Loss的訓練。
較佳的,步驟S2包括:當損失函數Triplet-Loss穩定且滿足收斂時,用第一域和第二域的最高維度特征計算最大均值差異損失MMD-Loss,并將結果加入合成損失函數,共同進行反向傳播和梯度求導。
較佳的,步驟S3包括:將合成損失函數中的MMD-Loss去除,并加入第一域和第二域的混合Triplet-Loss,進行加強內聚集的訓練。
較佳的,,步驟S4包括:當加強內聚集的訓練的合成損失函數收斂且小于設定值時,對訓練結果進行保存。
較佳的,步驟S1中,進行損失函數Triplet-Loss的訓練還包括:設置第一學習率,第一學習率初始值為0.001至0.01,每10輪進行損失函數Triplet-Loss的訓練,將第一學習率設置為0.7至0.9倍。
較佳的,步驟S2中,設置第二學習率,第二學習率的初始值小于第一學習率的初始值,每10輪進行加強內聚集的訓練,將第二學習率設置為0.7至0.9倍。
較佳的,第二學習率初始值為0.0001至0.001。
較佳的,步驟S3中,設置第三學習率,第三學習率的初始值小于第一學習率的初始值,每5輪進行加強內聚集的訓練,將第三學習率設置為0.7至0.9倍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳光啟空間技術有限公司,未經深圳光啟空間技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811500433.8/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





