[發明專利]融合聲音采集識別的場區智能視頻監控方法、裝置及系統有效
| 申請號: | 201811235358.7 | 申請日: | 2018-10-23 |
| 公開(公告)號: | CN109300471B | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 李偉娜;康興東;呂濤;滑常勇;崔永新;朱佳星;朱文濤;劉鴻慧;張建強 | 申請(專利權)人: | 中冶東方工程技術有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L25/21;G10L25/24;G10L25/30;H04N7/18 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 266555 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融合 聲音 采集 識別 場區 智能 視頻 監控 方法 裝置 系統 | ||
1.融合聲音采集識別的場區智能視頻監控方法,其特征是,包括:
采集布設在場區不同位置的麥克風獲取的聲音數據;對聲音數據進行預處理后進行存儲;
采集布設在場區不同位置的攝像頭獲取的視頻數據,對視頻數據進行存儲;
對振幅超過設定閾值的聲音進行聲源進行定位,對振幅超過設定閾值的聲音進行特征提取,根據提取的特征對聲音進行識別,判斷是否是場區內的異常聲音;
如果是異常聲音,則根據異常聲音的聲源位置對距離聲源位置距離最近的攝像頭的拍攝角度進行調整;
獲取調整角度后的攝像頭拍攝的視頻數據,將異常聲音和異常聲音對應的位置處的視頻數據進行合并后,進行記錄存儲,同時發出報警信號;
進行記錄存儲的具體步驟為:將麥克風位置、攝像頭位置、異常聲音聲源位置、關聯攝像頭當前拍攝方向、建議關聯攝像頭調整的方向及角度均設置在電子地圖中,形成數字地圖;隨著攝像頭拍攝方向的變化,數字地圖中的內容進行實時更新;
通過對同一聲音到達的判斷,確定此發聲點的相對區域位置信息,將異常的位置在數字化地圖中標定出來;
若檢定為異常聲音,則在數字地圖上,以此聲源的區域位置信息為圓心,確定離此異常聲音點最近的攝像頭,作為關聯攝像頭,通過對當前攝像頭拍攝方向A與異常點的連線方向B計算比較,確定攝像頭可以從方向A調整為方向B的角度。
2.如權利要求1所述的融合聲音采集識別的場區智能視頻監控方法,其特征是,
對振幅超過設定閾值的聲音進行聲源進行定位,具體步驟為:通過不同麥克風檢測到的振幅超過設定閾值聲音的時間差,對聲源位置進行確定,進而確定與聲源位置相鄰最近的兩個麥克風。
3.如權利要求1所述的融合聲音采集識別的場區智能視頻監控方法,其特征是,
對振幅超過設定閾值的聲音進行特征提取,具體提取的特征包括:振幅、短時能量特征或MFCC特征。
4.如權利要求1所述的融合聲音采集識別的場區智能視頻監控方法,其特征是,
根據提取的特征對聲音進行識別,判斷是否是場區內的異常聲音,具體步驟為:
預先構建神經網絡,利用場區的預先采集的正、負訓練樣本進行訓練,得到訓練好的神經網絡;將提取的特征輸入到訓練好的神經網絡中,輸出聲音識別結果,即:正常聲音或異常聲音。
5.如權利要求4所述的融合聲音采集識別的場區智能視頻監控方法,其特征是,
正訓練樣本的獲取步驟為:對場區內正常聲音進行采集,對聲音進行去噪和平滑預處理,然后進行特征提取,將提取的特征作為正訓練樣本;
負訓練樣本的獲取步驟為:對場區內異常聲音進行采集,對聲音進行去噪和平滑預處理,然后進行特征提取,將提取的特征作為負訓練樣本;異常聲音,包括場區越界、車輛沖撞、事故聲、爆炸聲、尖叫聲、犯罪行為聲音或玻璃破碎聲。
6.如權利要求1所述的融合聲音采集識別的場區智能視頻監控方法,其特征是,
如果是異常聲音,則根據異常聲音的聲源位置對距離聲源位置距離最近的攝像頭的拍攝角度進行調整的具體步驟為:
假設異常聲音聲源位置與攝像頭之間的連線和攝像頭的當前攝像方向之間的夾角為第一夾角;則將攝像頭的當前攝像方向朝聲源位置方向移動第一夾角的角度,完成角度的調整;
如果當前攝像頭達到極限角度,不能完成角度的調整,則選擇距離聲源位置第二近的攝像頭進行角度調整。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中冶東方工程技術有限公司,未經中冶東方工程技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811235358.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:混音分離方法和混音分離裝置
- 下一篇:一種語音識別方法、裝置、設備及介質





