[發(fā)明專利]具有組合視頻和音頻識別的視頻監(jiān)視系統(tǒng)和方法有效
| 申請?zhí)枺?/td> | 200680055514.0 | 申請日: | 2006-08-03 |
| 公開(公告)號: | CN101501564A | 公開(公告)日: | 2009-08-05 |
| 發(fā)明(設計)人: | M·G·基恩茲勒;V·舍伊寧 | 申請(專利權)人: | 國際商業(yè)機器公司 |
| 主分類號: | G03B17/00 | 分類號: | G03B17/00;G08B23/00;H04N7/18 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 黨建華 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 具有 組合 視頻 音頻 識別 監(jiān)視 系統(tǒng) 方法 | ||
技術領域
發(fā)明總的涉及用于提供安全性的監(jiān)視系統(tǒng)和方法,更具體地說, 涉及用于監(jiān)視系統(tǒng)的一種新的在線(實時)視頻和音頻識別系統(tǒng)和用 于監(jiān)視系統(tǒng)的處理。
背景技術
常規(guī)的視頻監(jiān)視系統(tǒng)一般不包括監(jiān)視音頻的任何功能或者措施; 即,監(jiān)視系統(tǒng)根本不包括音頻輸入。最多,典型的視頻監(jiān)視系統(tǒng),比 如在美國專利No.6724421和6175382中描述的視頻監(jiān)視系統(tǒng)提供視 覺信息和音頻信息的同時錄制。在這些參考文獻中描述的兩種視頻監(jiān) 視系統(tǒng)中,視頻數(shù)據(jù)由智能監(jiān)視引擎分析,并被壓縮以便進行數(shù)字存 儲。這些引擎實現(xiàn)各種識別算法,比如人臉識別,運動檢測,恐慌探 測,刺殺(stabbing)運動檢測等等。例如,當監(jiān)視高層建筑的入口 時,一種報警情況涉及一個人朝著另一人的突然快速運動,意味可能 的搶掠、毆打或類似行動。這種情況下,智能監(jiān)視引擎將識別(成功 率小于100%)快速的突然運動,并在監(jiān)控站產生警報。由于報警的 結果,警力可被調派到被監(jiān)控位置。顯然,快速的突然運動可能由兒 童跑向其父母/朋友產生,這種情況下,產生的警報變成虛假警報,這 會浪費警力的調派。智能監(jiān)視引擎誤檢測的另一后果是在真正的緊急 情況下,不產生警報。例如,當現(xiàn)場有一個以上的人時可能出現(xiàn)這種 情況。當發(fā)生真正的緊急情況時卻不派遣警力是目前的監(jiān)視系統(tǒng)的另 一缺陷。
圖1中描述了現(xiàn)有技術的只有視頻的監(jiān)視系統(tǒng)。攝像機陣列10 通過視頻鏈路11把視頻信息送入視頻壓縮引擎12。視頻信息被壓縮, 并通過鏈路16發(fā)給存儲裝置14以便長期保存。另外,視頻信息通過 相同的視頻鏈路11被送給視頻識別引擎13。視頻識別引擎13執(zhí)行視 頻識別任務,比如人臉識別、運動檢測等等,并產生通過鏈路17發(fā) 送給事件數(shù)據(jù)庫15和監(jiān)控站18的事件和警報。監(jiān)控站18可包含人 工操縱的監(jiān)控站,從而,操作員執(zhí)行特定數(shù)量的攝像機的實時視覺監(jiān) 控。當操作員認為的緊急情況發(fā)生時,是否向被監(jiān)控區(qū)調派警力或者 其它緊急響應隊伍取決于他/她的決定。根據(jù)上面的描述,顯然沒有利 用音頻信息,盡管在被監(jiān)控區(qū)通常能夠獲得這樣的音頻信息。
圖2中表示了錄制具有的現(xiàn)有視頻監(jiān)視系統(tǒng)。攝像機陣列20通 過視頻鏈路21把視頻信息送入視頻和音頻壓縮引擎22。同時,音頻 信息從麥克風陣列29經音頻鏈路30被送入視頻和音頻壓縮引擎22。 視頻和音頻信息被壓縮,并通過鏈路26被發(fā)給存儲裝置24以便長期 保存。類似地,視頻信息通過相同的視頻鏈路21被送入視頻識別引 擎23。視頻識別引擎23執(zhí)行視頻識別任務,比如人臉識別、運動檢 測等等,并產生通過鏈路27發(fā)給數(shù)據(jù)庫25和監(jiān)控站28的事件和警 報。監(jiān)控站28是人工操縱的監(jiān)控站,從而,操作員執(zhí)行特定數(shù)量的 攝像機的視覺監(jiān)控。當操作員認為的緊急情況發(fā)生時,是否向被監(jiān)控 區(qū)調派警力或者其它緊急響應隊伍取決于他/她的決定。根據(jù)上面的描 述,顯然沒有從音頻輸入提取有用的信息,盡管通常能夠在被監(jiān)控區(qū) 獲得的音頻信號中得到這樣的信息。
如上所述,第二種監(jiān)視系統(tǒng)同時錄制視頻和音頻信息,而且實現(xiàn) 用于各種視頻識別任務的智能監(jiān)視引擎。目前,在這些系統(tǒng)中,音頻 信息被壓縮和錄制,而不被分析。
當分析視頻輸入時,目前的監(jiān)視系統(tǒng)未利用相當寶貴的音頻信 息。顯然,這種音頻信息是有用的,并且在許多監(jiān)視情況下能夠被廣 泛使用。
從而,非常理想的是把音頻信息的使用引入視頻監(jiān)視系統(tǒng)中,預 期音頻信息的使用將會降低監(jiān)視系統(tǒng)產生的虛假警報的數(shù)目,而且提 高檢測到的真實警報的百分率,同時向評估報警的人提供更多的信 息。另外,和僅僅利用視頻信息不能發(fā)現(xiàn)一些事件相反,利用音頻和 視頻信息可以發(fā)現(xiàn)這些事件。
發(fā)明內容
從而,本發(fā)明的一個目的是提供一種視頻監(jiān)視系統(tǒng)和方法,包括 使用與從受監(jiān)視區(qū)獲得的音頻信息結合的視頻信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業(yè)機器公司,未經國際商業(yè)機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680055514.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





