[發明專利]人臉檢測方法和裝置在審
| 申請號: | 201710858134.0 | 申請日: | 2017-09-21 |
| 公開(公告)號: | CN107644209A | 公開(公告)日: | 2018-01-30 |
| 發明(設計)人: | 杜康 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司11204 | 代理人: | 王達佐,馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 方法 裝置 | ||
技術領域
本申請涉及計算機技術領域,具體涉及互聯網技術領域,尤其涉及人臉檢測方法和裝置。
背景技術
隨著互聯網技術的發展,人臉檢測技術應用到了越來越多的領域。例如,可以通過人臉檢測來進行身份驗證等。現有的人臉檢測方法通常是直接對所拍攝的圖像進行人臉區域的檢測。然而,人在運動狀態下(例如跑動狀態、跳躍狀態下)被拍攝的圖像通常較模糊,無法呈現清晰的人臉輪廓和五官,因而現有的方式存在著在模糊圖像的檢測結果的準確性較低的問題。
發明內容
本申請實施例的目的在于提出一種改進的人臉檢測方法和裝置,來解決以上背景技術部分提到的技術問題。
第一方面,本申請實施例提供了一種人臉檢測方法,該方法包括:獲取待檢測圖像;將待檢測圖像輸入至預先訓練的第一卷積神經網絡,得到人臉特征信息,其中,第一卷積神經網絡用于提取人臉特征;將待檢測圖像輸入至預先訓練的第二卷積神經網絡,得到語義特征信息,其中,第二卷積神經網絡用于提取圖像的語義特征;對人臉特征信息和語義特征信息進行解析,生成人臉檢測結果。
在一些實施例中,人臉特征信息包括第一人臉特征圖和多個第二人臉特征圖,其中,第一人臉特征圖中的每一個點用于表征待檢測圖像中與該點相對應的區域存在人臉的置信度,各個第二人臉特征圖中的每一個點用于表征待檢測圖像中與該點相對應的區域的位置信息,第一人臉特征圖和各個第二人臉特征圖分別以矩陣進行表示。
在一些實施例中,語義特征信息包括待檢測圖像中的每一個點屬于多個預設類別中的各個預設類別的概率,其中,多個預設類別包括背景類和以下至少一項:頭發類、眼睛類、鼻子類、嘴類、膚色類,語義特征信息以矩陣進行表示。
在一些實施例中,對人臉特征信息和語義特征信息進行解析,生成人臉檢測結果,包括:將人臉特征信息和語義特征信息進行結合,生成結合特征信息;將結合特征信息輸入至預先訓練的第三卷積神經網絡,得到人臉檢測結果,其中,第三卷積神經網絡用于表征人臉特征信息、語義特征信息與人臉檢測結果的對應關系。
在一些實施例中,將人臉特征信息和語義特征信息進行結合,生成結合特征信息,包括:按照以下任一方式將人臉特征信息和語義特征信息進行結合,生成結合特征信息:將人臉特征信息和語義特征信息按對應元素相乘,將人臉特征信息和語義特征信息按對應元素取最大,將人臉特征信息和語義特征信息按對應元素進行閾值截斷。
在一些實施例中,該方法還包括訓練第三卷積神經網絡的步驟,包括:提取預設的訓練樣本,其中,訓練樣本包括多個圖像的人臉特征信息和語義特征信息;將多個圖像中的每一個圖像的人臉特征信息和語義特征信息進行結合,得到該圖像的結合特征信息;利用機器學習方法,將多個圖像中的各個圖像的結合特征信息作為輸入,將人臉檢測結果作為輸出,訓練得到第三卷積神經網絡。
第二方面,本申請實施例提供了一種人臉檢測裝置,該裝置包括:獲取單元,配置用于獲取待檢測圖像;第一輸入單元,配置用于將待檢測圖像輸入至預先訓練的第一卷積神經網絡,得到人臉特征信息,其中,第一卷積神經網絡用于提取人臉特征;第二輸入單元,配置用于將待檢測圖像輸入至預先訓練的第二卷積神經網絡,得到語義特征信息,其中,第二卷積神經網絡用于提取圖像的語義特征;生成單元,配置用于對人臉特征信息和語義特征信息進行解析,生成人臉檢測結果。
在一些實施例中,人臉特征信息包括第一人臉特征圖和多個第二人臉特征圖,其中,第一人臉特征圖中的每一個點用于表征待檢測圖像中與該點相對應的區域存在人臉的置信度,各個第二人臉特征圖中的每一個點用于表征待檢測圖像中與該點相對應的區域的位置信息,第一人臉特征圖和各個第二人臉特征圖分別以矩陣進行表示。
在一些實施例中,語義特征信息包括待檢測圖像中的每一個點屬于多個預設類別中的各個預設類別的概率,其中,多個預設類別包括背景類和以下至少一項:頭發類、眼睛類、鼻子類、嘴類、膚色類,語義特征信息以矩陣進行表示。
在一些實施例中,生成單元包括:結合模塊,配置用于將人臉特征信息和語義特征信息進行結合,生成結合特征信息;輸入模塊,配置用于將結合特征信息輸入至預先訓練的第三卷積神經網絡,得到人臉檢測結果,其中,第三卷積神經網絡用于表征人臉特征信息、語義特征信息與人臉檢測結果的對應關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710858134.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種摩擦副密封結構
- 下一篇:一種組合橋面用梳齒形伸縮裝置





