[發明專利]基于視頻流的動態人臉識別方法及裝置在審
| 申請號: | 201711466486.8 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108288280A | 公開(公告)日: | 2018-07-17 |
| 發明(設計)人: | 徐宇杰;趙五岳;蘇亮亮;張波 | 申請(專利權)人: | 杭州宇泛智能科技有限公司 |
| 主分類號: | G06T7/20 | 分類號: | G06T7/20;G06K9/00 |
| 代理公司: | 廣州市越秀區哲力專利商標事務所(普通合伙) 44288 | 代理人: | 胡擁軍 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 層級網絡 動態人臉識別 視頻流 層級 處理數據 候選區域 級聯結構 人臉區域 神經網絡 輸入圖像 依次增大 關鍵點 檢出率 誤檢率 最大化 檢測 準確率 級聯 算法 細化 網絡 回歸 | ||
本發明公開了一種基于視頻流的動態人臉識別方法及裝置,該方法采用多任務級聯神經網絡,整個算法網絡分為四個層級,第一層級網絡對輸入圖像進行處理,第二層級網絡和第三層級網絡對候選區域進行兩次細化,通過框回歸獲取人臉區域,第四層級網絡進行關鍵點定位,由于前三個層級的網絡輸入跟模型大小是依次增大的,所做的任務也是越來越細致,因此更有利于級聯結構處理數據,最大化檢測效率跟準確率,檢測速度快,檢出率高、誤檢率低。
技術領域
本發明涉及人臉識別技術領域,尤其涉及基于視頻流的動態人臉識別方法及裝置。
背景技術
傳統人臉檢測算法和基于深度神經網絡的人臉檢測算法各有短長。傳統人臉檢測算法的優點是速度快,缺點是檢出率低、誤檢率高;基于深度神經網絡的人臉檢測算法的優點是檢出率高、誤檢率低,缺點是檢測速度慢。
發明內容
為了克服現有技術的不足,本發明的目的在于提供基于視頻流的動態人臉識別方法及裝置,旨在解決傳統人臉檢測算法檢出率低、誤檢率高的問題,以及基于深度神經網絡的人臉檢測算法速度慢的問題。
本發明的目的采用以下技術方案實現:
一種基于視頻流的動態人臉識別方法,包括:
圖像獲取步驟,獲取視頻流數據的一幀作為輸入圖像;
初步篩選步驟,在第一層級網絡中對輸入圖像進行處理,獲取候選區域及其框回歸向量組,對框回歸向量組中的候選向量進行評估和校準,再通過非極大化抑制去除重復的候選區域;
一次細化步驟,將初步篩選步驟得到的候選區域送入第二層級網絡進行一次細化處理,排除不符合要求的候選區域,通過框回歸執行校準,再利用非極大化抑制進行候選區域的合并;
二次細化步驟,將一次細化步驟得到的候選區域送入第三層級網絡進行二次細化處理,排除不符合要求的候選區域,通過框回歸執行校準,再利用非極大化抑制進行候選區域的合并,獲取人臉區域;
關鍵點定位步驟,將二次細化步驟得到的人臉區域送入第四層級網絡,進行關鍵點定位。
在上述實施例的基礎上,優選的,所述二次細化步驟后,還包括:
人臉跟蹤步驟,將當前幀的人臉區域進行放大,將放大后的人臉區域送入第三層級網絡,通過框回歸進行下一幀的人臉跟蹤。
在上述實施例的基礎上,優選的,所述人臉跟蹤步驟前,還包括:
標記步驟,標記每個人臉區域的ID。
在上述任意實施例的基礎上,優選的,所述初步篩選步驟中,在第一層級網絡中使用全卷機網絡對輸入圖像進行處理。
一種基于視頻流的動態人臉識別裝置,包括:
圖像獲取模塊,用于獲取視頻流數據的一幀作為輸入圖像;
初步篩選模塊,用于在第一層級網絡中對輸入圖像進行處理,獲取候選區域及其框回歸向量組,對框回歸向量組中的候選向量進行評估和校準,再通過非極大化抑制去除重復的候選區域;
一次細化模塊,用于將初步篩選模塊得到的候選區域送入第二層級網絡進行一次細化處理,排除不符合要求的候選區域,通過框回歸執行校準,再利用非極大化抑制進行候選區域的合并;
二次細化模塊,用于將一次細化模塊得到的候選區域送入第三層級網絡進行二次細化處理,排除不符合要求的候選區域,通過框回歸執行校準,再利用非極大化抑制進行候選區域的合并,獲取人臉區域;
關鍵點定位模塊,用于將二次細化模塊得到的人臉區域送入第四層級網絡,進行關鍵點定位。
在上述實施例的基礎上,優選的,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州宇泛智能科技有限公司,未經杭州宇泛智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711466486.8/2.html,轉載請聲明來源鉆瓜專利網。





