[發明專利]一種基于深度級聯神經網絡的高速人臉跟蹤方法及系統在審
| 申請號: | 202110403624.8 | 申請日: | 2021-04-15 |
| 公開(公告)號: | CN113284166A | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 陽光暖果(北京)科技發展有限公司 |
| 主分類號: | G06T7/246 | 分類號: | G06T7/246;G06N3/04;G06N3/08 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 江亞平 |
| 地址: | 100083 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 級聯 神經網絡 高速 跟蹤 方法 系統 | ||
1.一種基于深度級聯神經網絡的高速人臉跟蹤方法,其特征在于,包括:
步驟S1:建立包括多層級聯神經網絡的人臉跟蹤模型;
步驟S2:對所述人臉跟蹤模型進行訓練,得到訓練好的人臉跟蹤模型;
步驟S3:輸入人臉視頻幀到所述訓練好的人臉跟蹤模型,如果所述人臉視頻幀為第一幀或校準幀,則通過完整的所述多層級聯神經網絡進行檢測,得到人臉框位置;如果所述人臉視頻幀是后續幀,則將該幀的上一幀的輸出的人臉候選框作為輸入,輸入所述多層級聯神經網絡的最后一層進行檢測,得到人臉框位置。
2.根據權利要求1所述的基于深度級聯神經網絡的高速人臉跟蹤方法,其特征在于,所述步驟S1:建立包括多層級聯神經網絡的人臉跟蹤模型,具體包括:
建立多層級聯神經網絡,其中,所述多層級聯神經網絡的不同層級分別接收對應的不同分辨率尺度的圖像,并輸出逐漸精確的所述人臉候選框位置;每層神經網絡將上一層神經網絡輸出的所述人臉候選框,調整其分辨率后,作為該層的所述輸入。
3.根據權利要求1所述的基于深度級聯神經網絡的高速人臉跟蹤方法,其特征在于,所述步驟S2:對所述人臉跟蹤模型進行訓練,得到訓練好的人臉跟蹤模型,具體包括:
使用訓練數據進行端對端訓練,其中,所述訓練數據在每次迭代過程結束后根據所述人臉候選框的得分值進行篩選,同時,調整正負樣本的比例。
4.根據權利要求1所述的基于深度級聯神經網絡的高速人臉跟蹤方法,其特征在于,所述步驟S3:輸入人臉視頻幀到所述訓練好的人臉跟蹤模型,如果所述人臉視頻幀為第一幀或校準幀,則通過完整的所述多層級聯神經網絡進行檢測,得到人臉框位置;如果所述人臉視頻幀是后續幀,則將該幀的上一幀的輸出的人臉候選框作為輸入,輸入所述多層級聯神經網絡的最后一層進行檢測,得到人臉框位置,具體包括下述步驟:
步驟S31:判斷輸入的所述人臉視頻幀,如果該幀為第一幀或校準幀,則該幀通過所述多層級聯神經網絡的第一層進行檢測,并根據非極大值抑制算法進行篩選,得到人臉候選框;如果否,則跳至步驟S34;
步驟S32:將所述人臉候選框輸入下一層所述級聯神經網絡,并根據所述非極大值抑制算法進行篩選,得到所述人臉候選框;
步驟S33:重復步驟S32,直至所述級聯神經網絡的最后一層,輸出人臉框位置;
步驟S34:將所述后續幀的上一幀在所述級聯神經網絡的最后一層得到的輸出,輸入所述級聯神經網絡的最后一層,得到所述人臉候選框,并根據所述非極大值抑制算法進行篩選,輸出所述人臉框位置。
5.一種基于深度級聯神經網絡的高速人臉跟蹤系統,其特征在于,包括下述模塊:
模型構建模塊,用于建立包括多層級聯神經網絡的人臉跟蹤模型;
模型訓練模塊,用于對所述人臉跟蹤模型進行訓練,得到訓練好的人臉跟蹤模型;
人臉跟蹤模塊,用于輸入人臉視頻幀到所述訓練好的人臉跟蹤模型,如果所述人臉視頻幀為第一幀或校準幀,則通過完整的所述多層級聯神經網絡進行檢測,得到人臉框位置;如果所述人臉視頻幀是后續幀,則將該幀的上一幀的輸出的人臉候選框作為輸入,輸入所述多層級聯神經網絡的最后一層進行檢測,得到人臉框位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陽光暖果(北京)科技發展有限公司,未經陽光暖果(北京)科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110403624.8/1.html,轉載請聲明來源鉆瓜專利網。





