[發明專利]一種基于強化學習的駕駛員異常姿態監測方法有效
| 申請號: | 201910039704.2 | 申請日: | 2019-01-16 |
| 公開(公告)號: | CN109902562B | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 蔣建春;王肖;曾素華;張卓鵬;歐小龍;岑明 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06V20/59 | 分類號: | G06V20/59;G06V20/40 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 劉小紅;陳棟梁 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 強化 學習 駕駛員 異常 姿態 監測 方法 | ||
1.一種基于強化學習的駕駛員異常姿態監測方法,其特征在于,準備階段和檢測階段,其中準備階段包括:基于時間與空間變化的駕駛員動態行為,利用機器學習算法訓練得到駕駛員姿態檢測模型,結合保護動機理論建立具有引導性質的安全預警機制;
檢測階段包括以下步驟:
視頻獲取步驟:通過車載單目攝像機獲取駕駛員的駕駛視頻;
關鍵點檢測步驟:利用OpenPose關鍵點檢測系統標記視頻中每一幀圖像中駕駛員的面部關鍵點和骨骼關鍵點,使問題規模從圖像中的像素點轉換為駕駛員姿態變化的關鍵點;利用參考點重構并歸一化處理后的關鍵點的初始化狀態信息之間的拓撲關系提取駕駛員自然駕駛狀態特征;
關鍵幀序列提取步驟:若駕駛員處于非自然駕駛狀態,則進行關鍵幀提取, 關鍵幀序列提取方法基于強化學習的方式,通過姿態檢測模型反饋相應的獎勵,并根據獎勵和姿態變化更新動作價值函數, 每一個非自然狀態的發生都會更新動作價值函數,直到得到適用于每個駕駛員的穩定的關鍵幀提取策略, 通過關鍵幀提取策略經過一定時間的自適應在線訓練,得到最具代表性的關鍵幀序列;
姿態檢測步驟:若駕駛員處于自然駕駛狀態,則直接進行姿態檢測;若駕駛員處于非自然駕駛狀態,則進行關鍵幀提取,得到最具代表性的關鍵幀序列,并將其輸入姿態檢測模型;關鍵幀提取過程中若不滿足關鍵幀提取策略,則放棄該時刻的關鍵幀提取,直接進行姿態檢測;
安全預警步驟:根據姿態檢測步驟得到的檢測結果進行安全預警。
2.根據權利要求1所述的一種基于強化學習的駕駛員異常姿態監測方法,其特征在于,所述準備階段基于時間與空間變化的駕駛員動態行為,利用機器學習算法訓練得到駕駛員姿態檢測模型,結合保護動機理論建立具有引導性質的安全預警機制,具體包括:
所述姿態檢測模型的訓練包括從訓練集中采集多幀不連續圖像中的關鍵點作為姿態檢測模型的多維度輸入數據,該輸入數據從空間和時間上對駕駛員的特征以關鍵點的形式呈現,以類別作為姿態檢測模型的輸出結果;
所述安全預警機制從駕駛員對社會和交通法規的認識程度上對其駕駛姿態進行解釋,以駕駛員對于車內環境的響應來引導其駕駛行為。
3.根據權利要求1所述的一種基于強化學習的駕駛員異常姿態監測方法,其特征在于,所述關鍵點檢測步驟中,利用OpenPose關鍵點檢測系統只選取12個最能表述駕駛員行為的關鍵點和68個面部關鍵點,輸出其對應于圖像中的坐標值。
4.根據權利要求3所述的一種基于強化學習的駕駛員異常姿態監測方法,其特征在于,所述關鍵點檢測步驟中,OpenPose關鍵點檢測系統將研究對象從視頻中的每幀圖像的全部像素點變成關鍵點數據,包括將視頻中的每一幀圖像建模成G(N,W,V),N向量為80個關鍵點對應的編號,W向量為80個關鍵點對應的相對于以脖子為原點的79個相對二維坐標值,V向量為W向量對應的關鍵點相對于原點的曼哈頓距離,各個變量為:
Gq=(Nq,Wq,Vq) q=1,2…n
Nq=i i=1,2…80
Wq=(xi,yi)
i表示1-80個關鍵點,n表示某一動作的最大幀數、yo表示代表脖子關鍵點的坐標值、xo表示脖子關鍵點的坐標值、o表示脖子對應的關鍵點,xi,yi 表示各個關鍵點對應的坐標值,q為對應的視頻幀編號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910039704.2/1.html,轉載請聲明來源鉆瓜專利網。





