[發(fā)明專利]基于視頻流的動態(tài)人臉識別方法及裝置在審
| 申請?zhí)枺?/td> | 201711466486.8 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108288280A | 公開(公告)日: | 2018-07-17 |
| 發(fā)明(設(shè)計)人: | 徐宇杰;趙五岳;蘇亮亮;張波 | 申請(專利權(quán))人: | 杭州宇泛智能科技有限公司 |
| 主分類號: | G06T7/20 | 分類號: | G06T7/20;G06K9/00 |
| 代理公司: | 廣州市越秀區(qū)哲力專利商標(biāo)事務(wù)所(普通合伙) 44288 | 代理人: | 胡擁軍 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 層級網(wǎng)絡(luò) 動態(tài)人臉識別 視頻流 層級 處理數(shù)據(jù) 候選區(qū)域 級聯(lián)結(jié)構(gòu) 人臉區(qū)域 神經(jīng)網(wǎng)絡(luò) 輸入圖像 依次增大 關(guān)鍵點(diǎn) 檢出率 誤檢率 最大化 檢測 準(zhǔn)確率 級聯(lián) 算法 細(xì)化 網(wǎng)絡(luò) 回歸 | ||
1.一種基于視頻流的動態(tài)人臉識別方法,其特征在于,包括:
圖像獲取步驟,獲取視頻流數(shù)據(jù)的一幀作為輸入圖像;
初步篩選步驟,在第一層級網(wǎng)絡(luò)中對輸入圖像進(jìn)行處理,獲取候選區(qū)域及其框回歸向量組,對框回歸向量組中的候選向量進(jìn)行評估和校準(zhǔn),再通過非極大化抑制去除重復(fù)的候選區(qū)域;
一次細(xì)化步驟,將初步篩選步驟得到的候選區(qū)域送入第二層級網(wǎng)絡(luò)進(jìn)行一次細(xì)化處理,排除不符合要求的候選區(qū)域,通過框回歸執(zhí)行校準(zhǔn),再利用非極大化抑制進(jìn)行候選區(qū)域的合并;
二次細(xì)化步驟,將一次細(xì)化步驟得到的候選區(qū)域送入第三層級網(wǎng)絡(luò)進(jìn)行二次細(xì)化處理,排除不符合要求的候選區(qū)域,通過框回歸執(zhí)行校準(zhǔn),再利用非極大化抑制進(jìn)行候選區(qū)域的合并,獲取人臉區(qū)域;
關(guān)鍵點(diǎn)定位步驟,將二次細(xì)化步驟得到的人臉區(qū)域送入第四層級網(wǎng)絡(luò),進(jìn)行關(guān)鍵點(diǎn)定位。
2.根據(jù)權(quán)利要求1所述的基于視頻流的動態(tài)人臉識別方法,其特征在于,所述二次細(xì)化步驟后,還包括:
人臉跟蹤步驟,將當(dāng)前幀的人臉區(qū)域進(jìn)行放大,將放大后的人臉區(qū)域送入第三層級網(wǎng)絡(luò),通過框回歸進(jìn)行下一幀的人臉跟蹤。
3.根據(jù)權(quán)利要求2所述的基于視頻流的動態(tài)人臉識別方法,其特征在于,所述人臉跟蹤步驟前,還包括:
標(biāo)記步驟,標(biāo)記每個人臉區(qū)域的ID。
4.根據(jù)權(quán)利要求1或2所述的基于視頻流的動態(tài)人臉識別方法,其特征在于,所述初步篩選步驟中,在第一層級網(wǎng)絡(luò)中使用全卷機(jī)網(wǎng)絡(luò)對輸入圖像進(jìn)行處理。
5.一種基于視頻流的動態(tài)人臉識別裝置,其特征在于,包括:
圖像獲取模塊,用于獲取視頻流數(shù)據(jù)的一幀作為輸入圖像;
初步篩選模塊,用于在第一層級網(wǎng)絡(luò)中對輸入圖像進(jìn)行處理,獲取候選區(qū)域及其框回歸向量組,對框回歸向量組中的候選向量進(jìn)行評估和校準(zhǔn),再通過非極大化抑制去除重復(fù)的候選區(qū)域;
一次細(xì)化模塊,用于將初步篩選模塊得到的候選區(qū)域送入第二層級網(wǎng)絡(luò)進(jìn)行一次細(xì)化處理,排除不符合要求的候選區(qū)域,通過框回歸執(zhí)行校準(zhǔn),再利用非極大化抑制進(jìn)行候選區(qū)域的合并;
二次細(xì)化模塊,用于將一次細(xì)化模塊得到的候選區(qū)域送入第三層級網(wǎng)絡(luò)進(jìn)行二次細(xì)化處理,排除不符合要求的候選區(qū)域,通過框回歸執(zhí)行校準(zhǔn),再利用非極大化抑制進(jìn)行候選區(qū)域的合并,獲取人臉區(qū)域;
關(guān)鍵點(diǎn)定位模塊,用于將二次細(xì)化模塊得到的人臉區(qū)域送入第四層級網(wǎng)絡(luò),進(jìn)行關(guān)鍵點(diǎn)定位。
6.根據(jù)權(quán)利要求5所述的基于視頻流的動態(tài)人臉識別裝置,其特征在于,還包括:
人臉跟蹤模塊,用于將當(dāng)前幀的人臉區(qū)域進(jìn)行放大,將放大后的人臉區(qū)域送入第三層級網(wǎng)絡(luò),通過框回歸進(jìn)行下一幀的人臉跟蹤。
7.根據(jù)權(quán)利要求6所述的基于視頻流的動態(tài)人臉識別裝置,其特征在于,還包括:
標(biāo)記模塊,用于標(biāo)記每個人臉區(qū)域的ID。
8.根據(jù)權(quán)利要求5或6所述的基于視頻流的動態(tài)人臉識別裝置,其特征在于,所述初步篩選模塊用于在第一層級網(wǎng)絡(luò)中使用全卷機(jī)網(wǎng)絡(luò)對輸入圖像進(jìn)行處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州宇泛智能科技有限公司,未經(jīng)杭州宇泛智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711466486.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種多層級網(wǎng)絡(luò)的數(shù)據(jù)傳輸方法及網(wǎng)橋設(shè)備
- 一種基于分層結(jié)構(gòu)的分布式賬本系統(tǒng)
- 用于實現(xiàn)熱點(diǎn)賬戶的區(qū)塊鏈系統(tǒng)以及實現(xiàn)熱點(diǎn)賬戶的方法
- 用于無線網(wǎng)絡(luò)中的同步目標(biāo)選擇的系統(tǒng)和方法
- 一種基于AIS的海運(yùn)網(wǎng)絡(luò)層級劃分方法
- 一種跨網(wǎng)跨層級業(yè)務(wù)協(xié)同服務(wù)平臺系統(tǒng)
- 網(wǎng)絡(luò)和/或設(shè)備之間層級切換的頻譜共享
- 網(wǎng)絡(luò)安全威脅的告警方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 故障診斷方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于遙感影像的多層級網(wǎng)絡(luò)地圖智能生成方法





