[發(fā)明專利]迭代視頻圖片檢索方法與裝置在審
| 申請?zhí)枺?/td> | 201410520736.1 | 申請日: | 2014-09-30 |
| 公開(公告)號: | CN105528364A | 公開(公告)日: | 2016-04-27 |
| 發(fā)明(設計)人: | 楊鵬 | 申請(專利權(quán))人: | 株式會社日立制作所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 李國華 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 圖片 檢索 方法 裝置 | ||
技術領域
本發(fā)明涉及一種迭代視頻圖片檢索方法與裝置,更具體而言,涉 及一種大規(guī)模視頻監(jiān)控系統(tǒng)中的迭代視頻圖片檢索方法與裝置。
背景技術
視頻監(jiān)控系統(tǒng)在社會安防方面得到了廣泛的應用。在各個城市, 每年均有數(shù)十萬攝像頭被部署。中國現(xiàn)有的城市大規(guī)模監(jiān)控系統(tǒng)當 中,大量監(jiān)控設備已經(jīng)有所部署,包括攝像頭、編解碼設備、數(shù)字視 頻錄像機、存儲和回放系統(tǒng)等等。其中,相當一部分的攝像頭均符合 720P或者1080P高清標準。每天在視頻監(jiān)控系統(tǒng)運行的過程中,會 產(chǎn)生大量的視頻數(shù)據(jù),同時視頻監(jiān)控系統(tǒng)的運營要求將這些視頻數(shù)據(jù) 保留3個月到1年不等的時間。這些積累的視頻數(shù)據(jù),不僅占用非常 大的存儲空間和網(wǎng)絡帶寬,而且對于視頻內(nèi)容并沒有有效的分析和組 織。當需要在海量視頻內(nèi)容中查找所需的目標物體的時候(如人臉, 車,不明行李等等),需要操作人員花費大量的時間,進行人工觀看 排查。這樣做不僅會耗費大量的人力和時間,也會使查找的精度降低 很多。更重要的是,在公共安全領域,案件發(fā)生后的線索追查時間非 常寶貴,如果可以利用信息技術顯著提高視頻監(jiān)控內(nèi)容的排查速度, 這對于公民安全和社會穩(wěn)定都具有非常重要的意義。
近些年來,一些大規(guī)模的視頻分析和檢索系統(tǒng)逐漸被采納使用。 此類系統(tǒng)對視頻內(nèi)容進行實時或者在線的分析,并將分析后得到的對 應敏感特征(比如說人臉、車輛等)的描述(一般為特征向量)存儲 在數(shù)據(jù)庫當中。當用戶需要針對某個敏感特征進行排查的時候,可以 將敏感特征輸入到數(shù)據(jù)庫當中,進行比對排查,從而可以快速定位這 些敏感特征或者目標物體在海量視頻內(nèi)容里出現(xiàn)的情況。這樣做,一 方面可以大大提高海量視頻內(nèi)容中查找目標物體所需的時間,節(jié)省了 人力和物力;另一方面,可以避免由于人員疲勞而帶來的查找精度降 低的情況。在基于內(nèi)容的視頻檢索的過程中,一般將目標物體的特征 描述向量與海量視頻內(nèi)容所對應的特征數(shù)據(jù)中的特征向量進行比對, 計算特征向量之間的相似度(一般是特征向量之間的差別),最后將 檢索的結(jié)果集按照相似度由高到低(特征向量的差別由小到大)的順 序展現(xiàn)給用戶終端。
在小規(guī)模視頻監(jiān)控應用系統(tǒng)中,以上的方法已經(jīng)可以支持高速高 精度的視頻檢索。然而,在大規(guī)模視頻監(jiān)控應用系統(tǒng)中,簡單采用這 樣的檢索方法會造成檢索精度的降低。主要原因是大量的視頻內(nèi)容 中,同樣的目標物體或者敏感特征在不同的攝像頭、不同地點、不同 時間出現(xiàn)時,展現(xiàn)出的特征向量有些許差別。由于光照、角度、環(huán)境 等多方面的影響,其他非該目標物體的特征向量可能會展現(xiàn)更好的相 似度。同時,目標物體可能在某個時間和地點集中長時出現(xiàn),這樣可 能在單次檢索中集中展現(xiàn)在用戶界面上,而該目標物體在其他時間和 地點的出現(xiàn)情況沒有得到有效展現(xiàn)。因此,需要針對大規(guī)模視頻監(jiān)控 場景,對視頻檢索進行優(yōu)化和提升。
之前的一些工作已經(jīng)涉及到這方面的內(nèi)容。
在專利文獻1中描述了一種大規(guī)模視頻檢索的架構(gòu)設計。在這套 架構(gòu)中,重點強調(diào)如何使用并行計算來加速檢索的流程,然而如何解 決大規(guī)模視頻監(jiān)控系統(tǒng)中的視頻檢索精度的問題,沒有有效的手段。
在專利文獻2中描述了一種利用文本標注和基于內(nèi)容的特征進 行視頻檢索的方法。這種方法簡單地使用文本標注和對比結(jié)合基于內(nèi) 容的視頻檢索在一起,提高檢索精度。但是,在大規(guī)模視頻監(jiān)控系統(tǒng) 中,全面的文本標注是不可能完成的事情。同時,相當多的目標物體 和敏感特征無法用文本來表征。
在專利文獻3中提出了一種多資源的視頻元數(shù)據(jù)檢索及相關的 業(yè)務框架。在這里,更多的提及如何使用多種標注信息來進行視頻檢 索的業(yè)務和方法,并沒有提及如何來提升基于內(nèi)容的視頻檢索的精 度。在大規(guī)模視頻監(jiān)控系統(tǒng)中,這種方法無法保證高精度的檢索結(jié)果。
在專利文獻4中提出了一種支持視頻內(nèi)容檢索的設備。在該設備 中,可以將視頻和音頻的內(nèi)容進行混合檢索,從而提高精度。但是, 如何在大規(guī)模視頻監(jiān)控系統(tǒng)中,僅適用視頻內(nèi)容的檢索來提高精度并 沒有有效手段。
現(xiàn)有技術文獻
專利文獻
專利文獻1:美國專利US2014/0164406A1
專利文獻2:專利WO2014/082288
專利文獻3:美國專利US2013/0326573A1
專利文獻4:美國專利US2014/0188834
發(fā)明內(nèi)容
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社日立制作所,未經(jīng)株式會社日立制作所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410520736.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





