[發明專利]音視頻融合的人員入侵檢測方法無效
| 申請號: | 201210455136.2 | 申請日: | 2012-11-13 |
| 公開(公告)號: | CN102982634A | 公開(公告)日: | 2013-03-20 |
| 發明(設計)人: | 張重陽;王德富;鄭世寶 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G08B13/00 | 分類號: | G08B13/00;G06K9/00;G10L15/14 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 融合 人員 入侵 檢測 方法 | ||
1.一種音視頻融合的人員入侵檢測方法,其特征在于,所述方法包括如下步驟:
步驟一,基于HOG通過檢測區域收縮法進行快速人體識別;
步驟二,根據步驟一識別出的人體目標,基于MFCC使用高斯混合模型分類器進行實時腳步識別;
步驟三,基于貝葉斯網絡的音視頻融合決策。
2.根據權利要求1所述的音視頻融合的人員入侵檢測方法,其特征是,所述步驟一分為兩小步:
第一步,提取時空檢測區域:使用自適應高斯混合模型GMM進行前景提取,在時域上采用間隔檢測策略IDS,把圖像在寬度上分成K部分計算每個子區間的前景像素數量占整個前景的比例R,計算出來的子區間的值大于閾值即被選為檢測區域,對于上述得到的檢測區域做不平衡擴展UBD和重疊消除OVE;
第二步,在最終得到的區域上做基于HOG特征提取和人體識別檢測。
3.根據權利要求2所述的音視頻融合的人員入侵檢測方法,其特征是,所述的使用自適應高斯混合模型進行前景提取,具體為:在前景目標出現的時候進行檢測,假設前景目標出現當Rfg>Tfg,其中Rfg=Pixfg/Pixtotal,Pixfg和Pixtotal分別代表前景圖像和整個圖像的像素數量,Tfg是Pixfg/Pixtotal的比例閾值。
4.根據權利要求2所述的音視頻融合的人員入侵檢測方法,其特征是,所述的間隔檢測策略,具體為:把圖像在寬度上分成K個子區間,第k個子區間記作Bk,k的取值從1到K,Vk=Pixk/Pixfg,Pixk代表第k個子區間的前景像素數量,當Vk>Tb時,Bk被選為檢測區域。
5.根據權利要求2所述的音視頻融合的人員入侵檢測方法,其特征是,所述的不平衡擴展,具體為:如果Vk-1>Vk+1,檢測區域向左擴展η個子區間寬度,向右擴展1-η個子區間寬度,其中η>0.5,反之亦然,擴展后的區域被作為檢測區域;這里Vk=Pixk/Pixfg,Pixk代表第k個子區間的前景像素數量,Pixfg代表前景圖像的像素數量,故Vk-1表示第k-1個子區間前景像素占整個前景圖像像素的比例,Vk+1表示第k+1個子區間前景像素占整個前景圖像像素的比例。
6.根據權利要求2所述的音視頻融合的人員入侵檢測方法,其特征是,所述的重疊消除,具體為:當從前景像素比例中得到的兩個檢測區域是相鄰的,在不平衡擴展之后得到的檢測區域就會存在很多的重疊部分,選擇R值最大的那個擴展區域為檢測區域,另一個丟棄。
7.根據權利要求1-6任一項所述的音視頻融合的人員入侵檢測方法,其特征是,所述步驟二,具體為:將音頻信號分成固定長度為Wa的重疊時間窗口,Wa小于0.2S,將結果做些修正,若之前1s內有至少2次是腳步聲,則當前段若被檢測為非腳步聲更正為腳步聲。
8.根據權利要求1-6任一項所述的音視頻融合的人員入侵檢測方法,其特征是,所述的步驟三,具體為:最后的檢測結果E,視頻報警和音頻報警作為中間層,底層特征為腳步聲識別F、基于HOG的快速人體識別H和前景像素比例R。
9.根據權利要求8所述的基于貝葉斯網絡的音視頻融合決策,其特征是,底層特征為腳步聲識別F、基于HOG的快速人體識別H和前景像素比例R,視頻報警V和音頻報警A作為中間層,最后的輸出是人員入侵事件的檢測結果I,表示為:
運用貝葉斯鏈式法則,得到
這里ai、vk、im分別表示A、V、I所取的具體數值,該公式表示,在推理模型使用前,每個節點的先驗知識都可以從實驗開始前的初始化運行期間或者其它獨立的實驗中得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210455136.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:低排放發電廠
- 下一篇:一種燃氣管道在役焊接行為的結構分析方法





