[發明專利]基于視頻的人臉實時檢測方法及其裝置有效
| 申請號: | 200910201999.5 | 申請日: | 2009-12-21 |
| 公開(公告)號: | CN102103694A | 公開(公告)日: | 2011-06-22 |
| 發明(設計)人: | 羅小偉;林福輝 | 申請(專利權)人: | 展訊通信(上海)有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06T7/60 |
| 代理公司: | 上海明成云知識產權代理有限公司 31232 | 代理人: | 成春榮;竺云 |
| 地址: | 201203 上海市浦東張江*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 視頻 實時 檢測 方法 及其 裝置 | ||
技術領域
本發明涉及多媒體領域,特別涉及多媒體領域中的人臉檢測技術。
背景技術
近年來,諸如手機,數碼照相機等手持設備由于其便攜性和含有豐富的多媒體應用而越來越受消費者歡迎。而隨著手持設備的越來越普及,人們對作為諸多多媒體應用基礎技術的人臉檢測的需求也越來越迫切。
所謂人臉檢測,指的是在多媒體數據(包括圖像和視頻等)中檢測出所存在的所有人臉的位置,方向、大小以及人臉個數等信息的過程和方法。人臉檢測具有重要的意義,可以應用到人臉識別、視頻監控以及基于內容的檢索等領域,是上述應用中一個必不可少的構成。但人臉是一類具有非常復雜的細節變化的自然結構體,對人臉檢測的挑戰在于受姿態、外貌、表情、膚色、是否有眼鏡等遮擋物以及光學成像環境等諸多條件影響。人臉檢測的精度和速度是影響人臉檢測走向實際應用的兩個關鍵問題。經過20世紀90年代以來十多年的努力,人臉檢測的精度有了大幅提高。但速度還一直沒有得到很好解決。直到2001年Viola和Jones基于Adaboost的級聯檢測算法的提出,人臉檢測的速度才得到實質性的提高。相關的文獻顯示,對于分辨率在384×288大小的圖像,700MHz的Intel?Pentium?III處理器能實現每秒15幀的人臉檢測。因此目前已有在臺式機等設備上已能實現實時的人臉檢測。關于人臉檢測技術可參見專利號為“11195611”美國專利。
然而,本發明的發明人發現,由于在現有的人臉檢測技術中,對每一幀均是以固定步長搜索全部區域的方式進行檢測,因此人臉檢測過程的計算復雜度較高。而手持設備大都為嵌入式系統,其計算能力比較差、存儲能力較弱,因此很難實現實時的人臉檢測,會有延時、停頓和跳躍等現象。
發明內容
本發明的目的在于提供一種基于視頻的人臉實時檢測方法及其裝置,使得人臉檢測過程的計算復雜度大幅度降低,而且同樣保證檢測的準確性。
為解決上述技術問題,本發明的實施方式提供了一種基于視頻的人臉實時檢測方法,包含以下步驟:
預先將視頻圖像幀分為全檢測幀和預測檢測幀兩種類型的幀,全檢測幀為以固定小步長,采用實時人臉檢測算法對圖像整個區域進行全搜索檢測的圖像幀,預測檢測幀為基于預測,將圖像幀的檢測區域分割為人臉候選區域和非人臉區域,對人臉候選區域采用固定小步長,對非人臉區域采用固定大步長搜索檢測的圖像幀,固定大步長大于固定小步長;
如果當前輸入的視頻圖像幀與之前最近一個全檢測幀之間的幀數間隔大于預設閾值,則判定當前輸入的視頻圖像幀為全檢測幀,以全檢測幀的檢測方式進行檢測;如果當前輸入的視頻圖像幀與之前最近一個全檢測幀之間的幀數間隔小于或等于預設閾值,則判定當前輸入的視頻圖像幀為預測檢測幀,以預測檢測幀的檢測方式進行檢測;
在以全檢測幀的檢測方式或以預測檢測幀的檢測方式進行檢測后,輸出當前視頻圖像幀內所有檢測到的人臉的區域位置;
其中,第一個視頻圖像幀為全檢測幀。
本發明的實施方式還提供了一種基于視頻的人臉實時檢測裝置,包含視頻圖像幀輸入模塊、類型判斷模塊、檢測模塊和人臉區域輸出模塊;
視頻圖像幀輸入模塊用于將視頻圖像幀輸入到類型判斷模塊;
類型判斷模塊用于判斷當前輸入的視頻圖像幀的類型,視頻圖像幀的類型分為全檢測幀和預測檢測幀兩種,全檢測幀為以固定小步長,采用實時人臉檢測算法對圖像整個區域進行全搜索檢測的圖像幀,預測檢測幀為基于預測,將圖像幀的檢測區域分割為人臉候選區域和非人臉區域,對人臉候選區域采用固定小步長,對非人臉區域采用固定大步長搜索檢測的圖像幀,固定大步長大于固定小步長;
如果當前輸入的視頻圖像幀與之前最近一個全檢測幀之間的幀數間隔大于預設閾值,則類型判斷模塊判定當前輸入的視頻圖像幀為全檢測幀;如果當前輸入的視頻圖像幀與之前最近一個全檢測幀之間的幀數間隔小于或等于預設閾值,則類型判斷模塊判定當前輸入的視頻圖像幀為預測檢測幀;其中,第一個視頻圖像幀為全檢測幀;
檢測模塊用于根據類型判斷模塊判斷的類型,對當前輸入的視頻圖像幀進行檢測;
人臉區域輸出模塊用于輸出檢測模塊檢測到的當前視頻圖像幀內所有的人臉的區域位置。
本發明實施方式與現有技術相比,主要區別及其效果在于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于展訊通信(上海)有限公司,未經展訊通信(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910201999.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:個域網終端協同中切換控制系統和方法
- 下一篇:一種同頻和異頻關系的配置方法





