[發明專利]視頻語義檢索與壓縮同步的攝像系統與方法在審
| 申請號: | 201410115063.1 | 申請日: | 2014-03-26 |
| 公開(公告)號: | CN103905824A | 公開(公告)日: | 2014-07-02 |
| 發明(設計)人: | 修文群 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | H04N19/20 | 分類號: | H04N19/20;H04N19/70;H04N19/139;H04N19/85 |
| 代理公司: | 深圳市科進知識產權代理事務所(普通合伙) 44316 | 代理人: | 沈祖鋒;郝明琴 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 語義 檢索 壓縮 同步 攝像 系統 方法 | ||
技術領域
本發明涉及視頻數據處理領域,尤其涉及一種視頻語義檢索與壓縮同步的攝像系統與方法。
背景技術
目前對于視頻內容的搜索,一般采取圖像特征識別或者圖像語義抽取模式,兩者都需要在視頻采集后,通過模型算法或人工方法加以實施。面對城市管理中高速動態累積的海量視頻數據,上述后期集中式處理難以獲得滿意效果。
原因在于:對于視頻圖像特征的語義識別(顏色、形狀、紋理、速度),需針對原始圖像進行相關處理,一旦視頻被壓縮傳送到后臺,再提取上述信息,需對圖像進行二次解壓縮,因而擴大了數據處理量。
發明內容
有鑒于此,有必要研發一種視頻語義檢索與壓縮同步的攝像方法,以解決上述問題。
本發明的視頻語義檢索與壓縮同步的攝像方法,包括個性化設置與應用兩個階段,其中,個性化設置包括:(1.1)選擇特定目標的集合;(1.2)建立各特定目標的視頻特征語義庫;(1.3)在離線環境下對樣本視頻進行樣本訓練,用以獲取所述特定目標的訓練參數集;(1.4)將所述訓練參數集配置于分類器中;所述應用包括:(2.1)獲取實際視頻,開始壓縮,形成壓縮域視頻;(2.2)在壓縮域中提取關鍵幀;(2.3)在關鍵幀中提取運動對象;(2.4)在關鍵幀或運動對象中提取語義特征;(2.5)讀取分類器中的訓練參數集;(2.6)將提取的語義特征與訓練參數集進行匹配,獲得視頻語義的索引。
優選地,所述特定目標包括人流、車流、固定建筑物、路口中的一個或多個的組合。
優選地,所述語義庫的包括形狀特征、顏色特征、紋理特征及速度特征中的一種或多種的組合。
優選地,所述提取關鍵幀的方法包括根據視頻壓縮流中的關鍵幀I幀/P幀標記,或以固定時間間隔提取。
優選地,所述提取運動對象的步驟包括:在所述關鍵幀獲取每個編碼單元運動矢量;對所述運動矢量進行預處理;從所述運動矢量中提取運動矢量的幅度、角度;采用聚類等算法,根據所述幅度、角度以及其空間相關性、時間相關性特性提取區域運動對象;采用閾值分割方法分割運動特性分布圖,提取運動對象;分割對象后處理,通過區域生長和紋理信息,優化所述運動對象的邊緣。
本發明通過在攝像機端應用視頻語義檢索與壓縮同步的攝像方法,將上述規則庫的圖像語義抽取步驟在視頻采集壓縮過程中同步進行,從而充分發揮各攝像頭的分布式處理能力,大為減少計算量,使城市視頻數據的大規模識別、高效內容檢索成為可能。
附圖說明
圖1是本發明中視頻語義檢索與壓縮同步的攝像方法的設置步驟的示意圖。
圖2是本發明中視頻語義檢索與壓縮同步的攝像方法的設置步驟的示意圖。
圖3是本發明中在關鍵幀中提取運動對象的一實施方式示例圖。
圖4是本發明中在關鍵幀或運動對象中提取語義特征中的紋理對象為例的一實施方式示例圖。
圖5是本發明中所示為本發明實施方式中索引的結構示例圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清晰,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
在本發明中,視頻語義檢索與壓縮同步的攝像方法包括二個部分:
第一部分是個性化設置,如圖1所示,在使用前選擇特定目標,并形成特定目標的訓練參數集;
第二部分是應用,如圖2所示,將采集的視頻在壓縮的同時,將在關鍵幀中提取的語義特征與訓練參數集進行匹配,在完成壓縮的同時,形成語義索引。
實施例1個性化設置
請參閱圖1,所示為本發明中視頻語義檢索與壓縮同步的攝像方法的個性化設置步驟,具體包括:
在步驟S101中,初始化,并選擇特定目標的集合。
以智能城市中的監控探頭為例,其特定目標包括:人流、車流、固定建筑物、路口等。
在步驟S102中,建立各特定目標的視頻特征語義庫。
語義庫的內容通常包括形狀特征、顏色特征、紋理特征及速度特征中的一種或多種的組合。其中,分別將上述特征轉換成直方圖,并進行歸一化,使每種特征的度量空間一致,最后將三種特征矢量進行組合。
在步驟S103中,在離線環境下對樣本視頻進行樣本訓練,用以獲取訓練參數集。
通常訓練參數集會設定預設的次數,并當達到預設次數后結束訓練。所述訓練方法包括但不限于采用神經網絡等學習方法。
在步驟S104中,將訓練參數配置于分類器中。請簡單參閱圖5,所示為構造的索引結構圖,用于進行后續應用中的語義推理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410115063.1/2.html,轉載請聲明來源鉆瓜專利網。





