[發(fā)明專利]一種面向公交車的乘客對(duì)司機(jī)的暴力行為識(shí)別系統(tǒng)與方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011388004.3 | 申請(qǐng)日: | 2020-12-01 |
| 公開(公告)號(hào): | CN112766035B | 公開(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計(jì))人: | 王熙柱;李梓平;舒琳;黃毓敏;陳楚鈞;陳柏伶;趙源發(fā) | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G06V20/59 | 分類號(hào): | G06V20/59;G06V20/40;G06V20/52;G06V40/20;G06V10/80;G06V10/82;G10L15/22;H04N7/18 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 林梅繁 |
| 地址: | 510640 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 公交車 乘客 司機(jī) 暴力行為 識(shí)別 系統(tǒng) 方法 | ||
1.一種面向公交車的乘客對(duì)司機(jī)的暴力行為識(shí)別方法,其特征在于,包括以下步驟:
S1、通過視頻語(yǔ)音數(shù)據(jù)采集模型同步采集視頻流信息和語(yǔ)音流信息;
S2、利用視頻流識(shí)別模型中的視頻流特征提取模型對(duì)采集的視頻流信息進(jìn)行處理,并提取光流和RGB特征信息,獲取帶有時(shí)間空間信息的雙流圖,將雙流圖輸入視頻流識(shí)別模型中的動(dòng)作識(shí)別模型進(jìn)行識(shí)別,獲取動(dòng)作識(shí)別結(jié)果;
S3、利用語(yǔ)音流識(shí)別模型中的音頻流特征提取模型對(duì)采集的語(yǔ)音流信息進(jìn)行人聲檢測(cè)并進(jìn)行音頻波形轉(zhuǎn)換為頻譜圖的預(yù)處理,提取包含色譜圖、梅爾頻率倒譜系數(shù)的頻譜特征,輸入語(yǔ)音流識(shí)別模型中的語(yǔ)音識(shí)別模型,獲取語(yǔ)音識(shí)別結(jié)果;
S4、將動(dòng)作識(shí)別結(jié)果和語(yǔ)音識(shí)別結(jié)果輸入決策融合模型,獲取整個(gè)場(chǎng)景的識(shí)別結(jié)果;
S5、對(duì)整個(gè)場(chǎng)景的識(shí)別結(jié)果進(jìn)行判別,若出現(xiàn)異常狀況,則發(fā)出警報(bào);若為正常情況,則返回步驟S1繼續(xù)監(jiān)測(cè)場(chǎng)景狀況;
步驟S2的帶有時(shí)間空間信息雙流圖的獲取的具體步驟如下:
S21、利用每連續(xù)的兩幀圖像之間通過稠密光流法獲取稠密光流信息;
S22、將獲取的光流信息疊加成為包含時(shí)間信息的光流棧;光流信息疊加成為光流棧的過程為具體過程為:利用每相鄰兩幀計(jì)算一組光流信息,根據(jù)運(yùn)動(dòng)的區(qū)域計(jì)算出變化值delta,非運(yùn)動(dòng)的區(qū)域變化值為0;若為水平方向運(yùn)動(dòng),則獲得的相鄰幀光流信息格式為M=[0,0,…,deltan,…,0],其中,deltam為一個(gè)實(shí)數(shù),表示在位置m上發(fā)生運(yùn)動(dòng);連續(xù)的光流信息為相鄰的,即M=[0,0,…,deltam,…,0]的下一次光流信息為Mnext=[0,0,…,deltam+1,…,0],即n幀之間有n-1幀光流信息,其中,deltam+1為一個(gè)實(shí)數(shù),表明在位置m+1上發(fā)生的運(yùn)動(dòng);疊加后為光流棧:
S23、將獲取的光流棧疊加到含有空間信息的末幀灰度圖上面,獲取融合的包含場(chǎng)景的空間時(shí)間信息的雙流圖;
動(dòng)作識(shí)別模型、語(yǔ)音識(shí)別模型及決策融合模型為神經(jīng)網(wǎng)絡(luò)模型;
動(dòng)作識(shí)別模型利用遷移學(xué)習(xí)的方法,使用Inception-v3網(wǎng)絡(luò)和Inception-v3的初始權(quán)重進(jìn)行再訓(xùn)練;
語(yǔ)音識(shí)別模型利用RNN神經(jīng)網(wǎng)絡(luò);
決策融合模型利用后期融合的方法,在動(dòng)作識(shí)別模型輸出Alever=[p0,p1,p2,p3…pi],其中pi為動(dòng)作識(shí)別中第i個(gè)類別的置信度;在語(yǔ)音識(shí)別模型輸出Vlever=[q0,q1,q2,q3,q4,q5,q6…qi],其中,qi為語(yǔ)音識(shí)別中第i個(gè)類別的置信度;將動(dòng)作識(shí)別模型和語(yǔ)音識(shí)別模型輸出結(jié)果合并成一維矩陣:
[Alever,Vlever]=[p0,p1,p2,p3,p4,q0,q1,q2,q3,q4,q5,q6…qi]
其中,[Alever,Vlever]為融合層的輸入信號(hào);
將[Alever,Vlever]輸入兩層全連接層對(duì)動(dòng)作識(shí)別模型和語(yǔ)音識(shí)別模型進(jìn)行融合,輸出多個(gè)場(chǎng)景等級(jí),即輸出矩陣olever=[o0,o1,o2,o3…oi],其中,oi為最終識(shí)別中第i個(gè)類別的置信度。
2.根據(jù)權(quán)利要求1所述的暴力行為識(shí)別方法,其特征在于,步驟S1的視頻語(yǔ)音數(shù)據(jù)采集模型的視頻流信息采集的角度是以司機(jī)為中心的視角。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011388004.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于監(jiān)視和管理司機(jī)注意力負(fù)荷的系統(tǒng)和方法
- 司機(jī)室操縱臺(tái)
- 動(dòng)車組司機(jī)室操縱臺(tái)
- 網(wǎng)絡(luò)租車中實(shí)現(xiàn)司機(jī)、司機(jī)端設(shè)備、車輛相互綁定的方法
- 一種控制司機(jī)接單的方法、裝置及服務(wù)器
- 基于司機(jī)匹配度的貨源推送方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 基于公交ERP數(shù)據(jù)的司機(jī)考核評(píng)價(jià)系統(tǒng)
- 門機(jī)司機(jī)室
- 司機(jī)室骨架、司機(jī)室以及軌道車輛
- 一種地鐵車輛司機(jī)室防火間壁內(nèi)嵌磁鐵結(jié)構(gòu)





