[發(fā)明專利]一種頭部姿態(tài)檢測方法在審
| 申請?zhí)枺?/td> | 202010119229.2 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN111339941A | 公開(公告)日: | 2020-06-26 |
| 發(fā)明(設計)人: | 林士然;蔣磊 | 申請(專利權)人: | 蘇州瓴圖智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 蘇州根號專利代理事務所(普通合伙) 32276 | 代理人: | 仇波 |
| 地址: | 215123 江蘇省蘇州市工業(yè)園區(qū)*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 頭部 姿態(tài) 檢測 方法 | ||
本發(fā)明涉及一種頭部姿態(tài)檢測方法,它包括以下步驟:(a)選擇數(shù)據(jù)集;(b)對所述數(shù)據(jù)集中的人臉圖片進行預處理,隨后進行大小轉換得到設定大小的圖片;(c)對深度學習的模型構建以MobileNetv2作為骨干;(d)將所述設定大小的圖片放入所述神經(jīng)網(wǎng)絡進行分類;(e)對所述全連接層的結果做softmax以將所述全連接層的值映射成概率值;(f)對所述概率值進行映射得回歸,用MSE損失函數(shù)的方法計算回歸的損失概率;(g)對所述損失概率進行權重加權求和,并對最終的損失概率梯度方向,以完成深度學習模型的訓練;(h)將所述深度學習模型對兒童頭部進行測試。具有程序檢測速度快、能達到實時性。
技術領域
本發(fā)明涉及一種頭部姿態(tài)檢測方法,涉及一種利用計算機視覺技術中深度學習訓練模型對精神疾病兒童的頭部姿態(tài)進行檢測的方法。
背景技術
頭部姿態(tài)能夠幫助人們定位以傳遞一些豐富的信息,比如人們用他們的頭部指向來表明其對話對象和意圖。在一些對話中,頭部方向是一個非語言的公示,提醒傾聽者什么時候去轉換角色和開始說話;在這些對話中,頭部姿態(tài)方向和手勢的形式有著相同重要的作用。
對于一些自閉癥、多動癥或抽動癥兒童來說,頭部指向更能夠反映出這些孩子對于當前環(huán)境中所指的意圖是什么,可以方便治療師或者醫(yī)生了解這些孩子的想法。當今的頭部姿態(tài)檢測方法有多種:如早期使用探測器陣列方法(訓練很多的頭部探測器,每個檢測器適應一個特殊姿勢,然后指定一個離散姿勢到這些探測器上,相應的預測一些頭部姿態(tài));中期使用機器學習中的非線性回歸方法或者隨機森林算法;近期的一些算法是提取人臉的關鍵點,以深度學習訓練進行頭部姿態(tài)的預測。
但是上述方法存在一定的缺陷:都比較依賴于環(huán)境的影響。如果環(huán)境背景有很大的變換,或者檢測者的年齡有很大的差距(如具有自閉癥、多動癥或抽動癥等精神疾病的人群普遍是兒童,而兒童的頭部姿態(tài)檢測和成人略有不同),就容易造成檢測結構不準確。
發(fā)明內容
本發(fā)明目的是為了克服現(xiàn)有技術的不足而提供一種頭部姿態(tài)檢測方法,適用于具有自閉癥、多動癥或抽動癥等精神疾病的兒童。
為達到上述目的,本發(fā)明所采用的技術方案為:一種頭部姿態(tài)檢測方法,它包括以下步驟:
(a)選擇數(shù)據(jù)集;
(b)對所述數(shù)據(jù)集中的人臉圖片進行預處理,使用多任務級聯(lián)卷積神經(jīng)網(wǎng)絡對所述人臉圖片進行人臉檢測和切割,隨后進行大小轉換得到設定大小的圖片;
(c)對深度學習的模型構建以MobileNetv2作為骨干且分別連接三個全連接層的神經(jīng)網(wǎng)絡;
(d)將所述設定大小的圖片放入所述神經(jīng)網(wǎng)絡進行分類;
(e)對所述全連接層的結果做softmax以將所述全連接層的值映射成概率值;
(f)對所述概率值進行映射得回歸,用MSE損失函數(shù)的方法計算回歸的損失概率;
(g)對所述損失概率進行權重加權求和,并對最終的損失概率梯度方向,以完成深度學習模型的訓練;
(h)以鼻子為基礎點,水平的方向設置成x軸,垂直的方向設置成y軸,z軸則垂直于x軸與y軸形成的平面,環(huán)繞x軸、y軸、z軸順時針旋轉的角度定義為頭部姿態(tài)在pitch、yaw、roll方向的偏移角度,將所述深度學習模型對兒童頭部進行測試得到兒童頭部的姿勢位置。
優(yōu)化地,步驟(a)中,所述數(shù)據(jù)集是BIWI、300W-LP和AFLW2000數(shù)據(jù)集。
優(yōu)化地,步驟(b)中,所述預處理是將所述人臉圖片中不需要的背景或其它物體排除。
進一步地,步驟(b)中,所述多任務級聯(lián)卷積神經(jīng)網(wǎng)絡由PNet、RNet和Onet三個級聯(lián)的輕量級CNN完成。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州瓴圖智能科技有限公司,未經(jīng)蘇州瓴圖智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010119229.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:電源信號處理電路及用電系統(tǒng)
- 下一篇:一種懸片結構剛度估算方法





