[發明專利]頭部姿態估計方法及機器可讀存儲介質有效

申請號：	201810764042.0	申請日：	2018-07-12
公開（公告）號：	CN109034017B	公開（公告）日：	2021-05-14
發明（設計）人：	王行;李驪;盛贊;周曉軍;李朔;楊淼	申請（專利權）人：	北京華捷艾米科技有限公司
主分類號：	G06K9/00	分類號：	G06K9/00;G06K9/46
代理公司：	南京經緯專利商標代理有限公司 32200	代理人：	樓高潮
地址：	100193 北京市海淀***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	頭部姿態估計方法機器可讀存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明涉及圖像處理領域。本發明一實施例提供一種頭部姿態估計方法及機器可讀存儲介質，所述頭部姿態估計方法包括：獲取待進行頭部姿態估計的三基色彩色圖像與深度圖像；從所述三基色彩色圖像中提取出人臉區域，并基于所提取的人臉區域生成對應于所述三基色彩色圖像的人臉灰色圖像和對應于所述深度圖像的人臉深度圖像；提取所述人臉灰色圖像所對應的人臉輪廓圖像；以及將所述人臉灰度圖像、所述人臉輪廓圖像和所述人臉深度圖像輸入至頭部姿態估計模型，以由該頭部姿態估計模型輸出頭部姿態估計結果。由此，能夠實現基于單幀人臉圖像的頭部姿態估計，并能保障較高的估計精確度和效率。

技術領域

本發明涉及圖像處理領域，具體地涉及一種頭部姿態估計方法及機器可讀存儲介質。

背景技術

頭部姿態估計是從數字圖像或視頻圖像中推斷出人的頭部偏轉角度的過程。頭部姿態估計屬于人臉標定與識別的細分領域，主要用于輔助人臉關鍵點的標定與側臉圖像識別等相關任務。

在人臉識別的過程中，通常如果能在檢測到人臉之后，在人臉上自動標注出關鍵點在圖像上的像素位置之前，給出一個人臉的較為精確的朝向(即頭部姿態)的話，對人臉的關鍵點標定就會變得更加簡單和準確。具體地，在人臉識別問題上，側臉與正臉的對比識別一直是一個技術難點，而如果在進行人臉識別之前就能夠預先知道人臉的朝向的話，便可以從數據庫中調取已存好的與輸入人臉的朝向大致相同的已有人臉圖像，并進行比對，從而大幅度地提高人臉識別算法的判別精度。

除了配合其他復雜算法以提升算法性能之外，對人臉圖像進行頭部姿態估計還可以用來完成某些特定任務。例如在行車過程中，對駕駛員的面部朝向的估計可以用于判斷該駕駛員當前的視角方向，及時提醒其注意前方的可能危險。在教學場景中，對學員的頭部姿態估計可以用來評估學員聽課的專心程度，幫助講師更好地進行課堂管理工作。

目前主流的頭部姿態估計算法，其一，是基于彩色RGB圖片進行直接估計，這一類方法由于只含有平面信息，且易受光照、復雜背景等外部因素的影響，因此精度普遍不高；其二，是通過預先標定人臉關鍵點來進行的，即通過關鍵點的位置信息和幾何關系來估計出人臉的朝向，但人臉關鍵點標定的過程一般較為緩慢，且頭部姿態的估計精度直接取決于關鍵點的標定精度，致使其的實用性不高；其三，通過光流圖技術，即基于視頻流中兩幀圖像之間的光流圖來實現對頭部姿態的精確估計，但由于該方法使用了光流圖，因此只能用于視頻數據，無法用于單幀圖像，且該方法的深度學習模型設計的非常大，導致處理速度較慢而無法使用CPU進行實時運算。

發明內容

本發明實施例的目的是提供一種頭部姿態估計方法及機器可讀存儲介質，用以至少解決目前相關技術中的頭部姿態估計方法所存在的精度不夠、實用性不強和處理速度緩慢的問題。

為了實現上述目的，本發明實施例提供一種頭部姿態估計方法，包括：獲取待進行頭部姿態估計的三基色彩色圖像與深度圖像；從所述三基色彩色圖像中提取出人臉區域，并基于所提取的人臉區域生成對應于所述三基色彩色圖像的人臉灰色圖像和對應于所述深度圖像的人臉深度圖像；提取所述人臉灰色圖像所對應的人臉輪廓圖像；以及將所述人臉灰度圖像、所述人臉輪廓圖像和所述人臉深度圖像輸入至頭部姿態估計模型，以由該頭部姿態估計模型輸出頭部姿態估計結果。

本發明實施例另一方面提供一種機器可讀存儲介質，該機器可讀存儲介質上存儲有指令，該指令用于使得機器執行本申請上述的頭部姿態估計方法。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京華捷艾米科技有限公司，未經北京華捷艾米科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810764042.0/2.html，轉載請聲明來源鉆瓜專利網。