[發明專利]用于數據擴增的方法、裝置和系統、計算機可讀存儲介質在審
| 申請號: | 201810044176.5 | 申請日: | 2018-01-17 |
| 公開(公告)號: | CN108256473A | 公開(公告)日: | 2018-07-06 |
| 發明(設計)人: | 曾玲 | 申請(專利權)人: | 北京綻放時代科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 北京康盛知識產權代理有限公司 11331 | 代理人: | 張宇峰 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 擴增 深度特征 特征圖 計算機可讀存儲介質 原始圖像信息 數據集合 訓練樣本 原始圖像 有效地實現 本質信息 人臉識別 分類器 圖像 網絡 | ||
實施例公開一種用于數據擴增的方法,包括:接收原始圖像信息,所述原始圖像信息為一數據集合中的訓練樣本;獲得所述原始圖像的多張特征圖;其中,每張特征圖都包括所述原始圖像的深度特征信息;對每張特征圖進行擴展,獲得每張特征圖的多張擴展圖;并,將所述多張特征圖的所有擴展圖作為訓練樣本加入所述數據集合。該實施例提出一種基于深度特征信息的數據擴增方式,由于在圖像的深度特征信息的基礎上進行的數據擴增,因此能從物體的深度特征出發找到物體本質信息。將基于深度特征信息的數據擴增技術和人臉識別網絡相結合,能夠更加有效地實現對識別分類器的訓練。實施例還公開一種用于數據擴增的裝置和系統,及計算機可讀存儲介質。
技術領域
本發明涉及人工智能技術領域,特別涉及一種用于數據擴增的方法、裝置和系統,及計算機可讀存儲介質。
背景技術
人臉識別技術是計算機視覺應用中的一個重要環節,在很多實際應用場景中有著廣泛的使用前景。人臉識別技術主要可以分成兩種任務:人臉驗證技術和人臉歸類技術。驗證技術需要輸入兩張人臉,通過運算判斷兩張人臉是否為同一個人。歸類技術和驗證技術有一定的區別,其先對一張圖片進行特征提取,然后將該圖片的特征和數據庫中所有圖片特征進行比對,選出該照片是數據庫中的哪一個人。隨著深度學習的不斷發展,針對人臉識別的深層神經網絡結構越來越多。隨之而來的是關于訓練數據集的需求不斷增大。
當前在用于訓練人臉識別模型的公開數據集中,不可避免的存在一些樣本含有的人臉數量比較少的問題。這會對人臉識別歸類問題的訓練過程造成很大的影響。在歸類問題的訓練過程中,會根據每一個人劃分成不同的分類。只有每一個分類中有充分的數據,才能夠保證該分類具有良好的區分性。數據集合不平衡會造成如果在訓練集合中該人的照片特別少,會使得在該類別的訓練不準確,從而不具有很好的區分性。這種存在某個樣本類人臉數目過少的情況被稱做數據集合的不平衡。
只有能夠很好的解決數據集合不平衡的問題,才能夠保證我們在訓練過程中,充分地訓練出具有較好區分性的人臉識別模型。因此提出了融合擴增技術的人臉識別算法,在進行人臉識別模型訓練前,利用擴增技術平衡數據集合,然后在進行識別任務的訓練和處理。
隨著擴增技術對人臉識別任務的積極作用被證實,越來越多的擴增方式開始使用在識別過程中。其中廣泛應用在人臉識別技術中的數據擴增方式包括:鏡像(mirroring)、隨機裁剪(random cropping)、旋轉(rotating)等。鏡像擴增方式,將輸入的原圖進行水平的鏡像處理。新生成的圖片作為擴增后的數據送入數據集合之中進行訓練。裁剪擴增對圖像邊界上的像素進行隨機的裁剪。旋轉擴增在原圖的基礎上,選定一個旋轉角度,對該圖按照定的方向進行旋轉。
含有傳統數據擴增的人臉識別算法主要分成兩個過程,第一個過程是數據擴增,第二個過程是識別網絡的訓練。數據擴增階段對輸入算法中的原圖進行處理,通過鏡像、隨機裁剪或旋轉之后得到圖片。識別網絡訓練中,將擴增好的數據送入到神經網絡中進行特征提取(Feature extraction),得到特征(Feature)信息之后再進行分類器(classifier)的訓練。
這種含有傳統方式數據擴增技術的人臉識別方案,能夠一定程度上實現對數據規模上的增加,緩解數據不平衡的問題。但是在該識別算法的數據擴增技術中,增加了數據規模的同時,真正處于有效擴增范圍內的數據有限,同時由于沒能很好的結合數據的深層語義信息,很容易引起訓練過程的收斂過慢等問題。下面將具體介紹現有結合數據擴增技術的人臉識別技術的局限性:
對輸入原圖進行操作,沒有能夠很好的結合出圖片的深度特征信息。深度卷積神經網絡中,原圖信息會在之后的深度學習過程中轉換成為深度特征信息。只對原圖進行簡單的變換處理作為數據擴增方式,忽略了圖像本質的深度特征信息,在收斂速度和效果上都有一定的影響。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京綻放時代科技有限公司,未經北京綻放時代科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810044176.5/2.html,轉載請聲明來源鉆瓜專利網。





