[發(fā)明專利]基于SVM的攝像頭運動參數(shù)估計方法有效
| 申請?zhí)枺?/td> | 201210206007.X | 申請日: | 2012-06-20 |
| 公開(公告)號: | CN102737387A | 公開(公告)日: | 2012-10-17 |
| 發(fā)明(設(shè)計)人: | 孫美君;王語斌;江健民;王征 | 申請(專利權(quán))人: | 天津大學(xué) |
| 主分類號: | G06T7/20 | 分類號: | G06T7/20 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 svm 攝像頭 運動 參數(shù)估計 方法 | ||
所屬技術(shù)領(lǐng)域
本發(fā)明屬于計算機(jī)視頻分析領(lǐng)域,涉及一種攝像頭運動參數(shù)估計方法。
背景技術(shù)
近些年來,隨著計算機(jī)技術(shù)的發(fā)展,大量的數(shù)字視頻涌現(xiàn)。視頻數(shù)據(jù)的分析越來越受到眾人的關(guān)注。對于攝像機(jī)拍攝的視頻數(shù)據(jù),攝像機(jī)在拍攝過程中的運動參數(shù),是視頻數(shù)據(jù)本身的重要特征。該特征可以用于視頻檢索、視頻分析、版權(quán)檢測等領(lǐng)域。
目前對于攝像頭運動參數(shù)估計技術(shù),普遍采用的是一種成型的數(shù)學(xué)模型,在此數(shù)學(xué)模型的基礎(chǔ)之上,通過分析視頻數(shù)據(jù)中的相關(guān)特征,利用數(shù)學(xué)推導(dǎo)(如最小二乘法等),對模型進(jìn)行回歸,從而確定視頻不同幀(frame)之間攝像頭的運動參數(shù)。但是,這模型的準(zhǔn)確度就無法得到證實,這些提取出的模型在數(shù)學(xué)處理過程中許多地方都是采取了經(jīng)驗的方法,因此這些模型的適應(yīng)性本身只得懷疑。另外,由于視頻分析需要處理大量的數(shù)據(jù),對于處理速度也有較高的要求,因此在處理過程中如何通過篩選信息,在保證參數(shù)估計準(zhǔn)確性的前提下,提高估計的效率,也是一個需要重點考慮的問題。
發(fā)明內(nèi)容
本發(fā)明的目的是,克服現(xiàn)有技術(shù)的上述不足,提供一種能夠在保證參數(shù)估計準(zhǔn)確性的前提下提高估計效率的攝像頭運動參數(shù)估計方法。本發(fā)明通過支持向量機(jī)(SVM)的強大的數(shù)學(xué)計算功能,對于壓縮域的mpeg格式的視頻數(shù)據(jù),估計在拍攝該段視頻數(shù)據(jù)時攝像頭的運動參數(shù),并且在保證結(jié)果準(zhǔn)確的前提下,提高攝像頭運動參數(shù)估計的速度。本發(fā)明的技術(shù)方案如下:
一種基于SVM的攝像頭運動參數(shù)估計方法,包括下列步驟:
1)獲取攝像頭運動參數(shù)估計的訓(xùn)練數(shù)據(jù)真實值,得到支持向量機(jī)訓(xùn)練所需要的標(biāo)定值;
2)對于mpeg格式視頻,選取畫面組里的P幀作為處理對象,從中選擇采用幀間編碼的宏塊中存儲的運動向量不為零的宏塊作為宏塊級的處理數(shù)據(jù),從而得到支持向量機(jī)的訓(xùn)練數(shù)據(jù);
3)將以上過程中得到的數(shù)據(jù),轉(zhuǎn)化成支持向量機(jī)可以識別的格式,設(shè)定好支持向量機(jī)的各種參數(shù),其中核函數(shù)選擇多項式,訓(xùn)練模型選擇回歸模式,對輸入的訓(xùn)練數(shù)據(jù)進(jìn)行多次迭代,得到訓(xùn)練好的支持向量機(jī)模型;
4)對于在現(xiàn)實世界中拍攝的視頻片段,通過上述步驟2)中的篩選過程得到該視頻片段的運動向量,將運動向量輸入到已訓(xùn)練好支持向量機(jī)模型中,由支持向量機(jī)給出預(yù)測結(jié)果,實現(xiàn)對現(xiàn)實世界視頻片段的運動參數(shù)估計。
本發(fā)明通過支持向量機(jī)得到的攝像頭運動參數(shù)模型是可以重復(fù)利用的。因此,只需要一次訓(xùn)練就可以得到訓(xùn)練模型。此外,本發(fā)明中在壓縮域中處理數(shù)據(jù),并且對要處理的數(shù)據(jù)進(jìn)行合理的篩選,大大縮減了所需處理的數(shù)據(jù)的規(guī)模,提高了運動參數(shù)估計的效率。
附圖說明
圖1Mpeg視頻格式結(jié)構(gòu)如圖1;
圖2本發(fā)明的程序流程圖。
具體實施方式
下面首先說明本發(fā)明的技術(shù)方案。
1.獲取攝像頭運動參數(shù)估計的訓(xùn)練數(shù)據(jù)真實值,得到支持向量機(jī)訓(xùn)練所需要的標(biāo)定值。
利用支持向量機(jī)估計數(shù)學(xué)模型必須有盡可能準(zhǔn)確的訓(xùn)練數(shù)據(jù)。具體到攝像頭運動參數(shù)估計這個問題,需要得到盡可能準(zhǔn)確的攝像頭運動參數(shù)的真實值。在本發(fā)明中,主要通過兩種方法來獲取。
1)3dmax軟件可以建立3d的模型,并且可以人工的設(shè)定攝像頭的運動參數(shù),然后將整個攝像頭運動過程中,背景和物體的圖像錄制成視頻數(shù)據(jù)。而這些人工設(shè)定的運動參數(shù)可以通過文本的形式保存下來。利用編程語言稍微處理,便可以得到對應(yīng)幀的攝像頭的運動參數(shù)。
2)在沒有3dmax軟件的情況下,也可以采用傅立葉梅林變換(Fourier-Merlin?Transform)的方法,得到兩張圖片的全局坐標(biāo)變化。這種獲取方法,首先要將視頻的每一幀保存成圖像,然后輸入給傅立葉梅林程序。傅立葉梅變換程序會給出兩幅圖片的全局坐標(biāo)變換值。對于視頻中相鄰兩幀的全局左邊變換可以作為攝像頭運動參數(shù)估計的測試數(shù)據(jù)真值。
1.篩選所要處理的數(shù)據(jù),并且最終得到支持向量機(jī)的訓(xùn)練數(shù)據(jù)
數(shù)據(jù)的篩選環(huán)節(jié)關(guān)系到攝像頭運動參數(shù)估計的準(zhǔn)確性和估計效率的問題,是整個技術(shù)方案的重要組成部分。
1)分析的視頻是mpeg格式的視頻
視頻分析選擇的數(shù)據(jù)格式是mpeg格式。Mpeg格式是一個很成熟的壓縮視頻存儲格式。目前mpeg格式的視頻有了很廣泛的應(yīng)用。本發(fā)明對視頻數(shù)據(jù)的分析和處理直接在壓縮域中進(jìn)行操作的,這樣避免了視頻解壓縮過程中的開銷,大大減少的需要處理的數(shù)據(jù)量。
2)Mpeg格式視頻的幀的選取
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210206007.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:消防高層供水保護(hù)器
- 下一篇:遠(yuǎn)程手動控制滅火器噴管





