[發(fā)明專利]一類基于張量自回歸滑動(dòng)平均模型的視頻分類方法在審
| 申請?zhí)枺?/td> | 202110028634.8 | 申請日: | 2021-01-08 |
| 公開(公告)號(hào): | CN112801142A | 公開(公告)日: | 2021-05-14 |
| 發(fā)明(設(shè)計(jì))人: | 王少帆;鄔玉潔;孔德慧;尹寶才 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06K9/00;G06F16/75 |
| 代理公司: | 北京思海天達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一類 基于 張量 回歸 滑動(dòng) 平均 模型 視頻 分類 方法 | ||
1.一類基于張量自回歸滑動(dòng)平均模型的視頻分類方法,其特征在于包括以下步驟:
步驟一:對待分類的原始視頻數(shù)據(jù)進(jìn)行張量表示,得到每段視頻的視頻序列張量;
步驟二:將每個(gè)視頻序列張量編碼成一個(gè)自回歸滑動(dòng)平均模型,進(jìn)而求解得到模型中的參數(shù),即核張量觀測矩陣轉(zhuǎn)移矩陣
步驟三:根據(jù)步驟二得到的模型參數(shù),將每個(gè)待分類的原始視頻數(shù)據(jù)表示為乘積格拉斯曼流形點(diǎn),并在乘積格拉斯曼流形上計(jì)算每個(gè)待分類的原始視頻數(shù)據(jù)到其他所有待分類的原始視頻數(shù)據(jù)的距離:
步驟四:利用步驟三得到的距離進(jìn)行視頻分類。
2.根據(jù)權(quán)利要求1所述的一類基于張量自回歸滑動(dòng)平均模型的視頻分類方法,其特征在于:步驟一所述的張量表示包括兩種情況,即:
第一種情況:原始視頻數(shù)據(jù)經(jīng)過特征提取處理后轉(zhuǎn)變?yōu)樘卣饕曨l幀序列,直接將提取后的特征視頻幀序列看作是一個(gè)三階張量,張量的三個(gè)維度分別表示特征圖像的寬度l1、高度l2和視頻幀序列個(gè)數(shù)Z;
第二種情況:原始視頻數(shù)據(jù)未經(jīng)過處理,引入一個(gè)基于視頻幀塊的視頻表示方法,具體為:首先對原始視頻提取視頻幀,將每個(gè)視頻幀平均地分成大小相等的視頻幀塊,然后對每個(gè)視頻幀的視頻幀塊采用GIST算子進(jìn)行特征提取,每個(gè)視頻幀形成一個(gè)特征矩陣,特征矩陣中的列向量對應(yīng)視頻幀塊的特征;最后按照原始視頻的時(shí)間順序?qū)⑺刑卣骶仃嚺帕袠?gòu)建成視頻序列張量。
3.根據(jù)權(quán)利要求1所述的一類基于張量自回歸滑動(dòng)平均模型的視頻分類方法,其特征在于:步驟二所述的自回歸滑動(dòng)平均模型建模過程如下:
將視頻序列張量看作是一個(gè)ARMA模型的輸出,對于n階視頻張量序列N表示視頻序列總數(shù)目,構(gòu)建自回歸滑動(dòng)平均模型:
其中,是n階核張量,是滿足列正交約束的觀測矩陣,是滿足列正交約束的轉(zhuǎn)移矩陣,m表示觀測矩陣和轉(zhuǎn)移矩陣的個(gè)數(shù),且滿足m=n;
將模型轉(zhuǎn)化成需要優(yōu)化的目標(biāo)函數(shù):
4.根據(jù)權(quán)利要求3所述的一類基于張量自回歸滑動(dòng)平均模型的視頻分類方法,其特征在于:步驟二所述的自回歸滑動(dòng)平均模型參數(shù)求解過程如下:
輸入:N個(gè)n階視頻張量
輸出:核張量觀測矩陣轉(zhuǎn)移矩陣
(1)、隨機(jī)初始觀測矩陣滿足隨機(jī)初始轉(zhuǎn)移矩陣滿足
(2)、循環(huán)求解D1,D2,D3,…,Dm,直到循環(huán)收斂:
結(jié)束循環(huán);
(3)、計(jì)算核張量
(4)、循環(huán)求解E1,E2,E3,…,Em,直到循環(huán)收斂:
結(jié)束循環(huán);
其中,SVD表示對矩陣做奇異值分解的函數(shù),U稱為左奇異矩陣,Σ稱為奇異值,V稱為右奇異矩陣,計(jì)算過程只用到了左奇異矩陣U,a(1),a(2),...,a(n)表示張量的模n展開,L1,L2,...,Ln表示核張量的大小。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110028634.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于快速張量魯棒模型的視頻前景提取方法
- 運(yùn)算方法及相關(guān)方法和產(chǎn)品
- 張量寄存器文件
- 一種張量轉(zhuǎn)置方法、裝置、計(jì)算機(jī)及存儲(chǔ)介質(zhì)
- 一種基于張量的背景減除方法及系統(tǒng)
- 分解后的多維圖像的存儲(chǔ)、顯示和分析
- 在深度神經(jīng)網(wǎng)絡(luò)中利用激活稀疏性
- 一種基于張量鏈分解的流式數(shù)據(jù)增量處理方法及裝置
- 一種基于浮動(dòng)車數(shù)據(jù)加權(quán)張量重建的交通狀態(tài)估計(jì)方法
- 基于廣播機(jī)制進(jìn)行張量計(jì)算的方法、裝置、芯片及介質(zhì)





