[發(fā)明專利]視頻分類模型訓(xùn)練方法、視頻分類方法、裝置及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202010737337.6 | 申請日: | 2020-07-28 |
| 公開(公告)號: | CN111860399A | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計)人: | 吳宇斌;尹康;郭烽 | 申請(專利權(quán))人: | OPPO廣東移動通信有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 張靜;張穎玲 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 分類 模型 訓(xùn)練 方法 裝置 電子設(shè)備 | ||
1.一種視頻分類模型訓(xùn)練方法,其特征在于,包括:
將至少一個視頻樣本輸入至視頻分類模型,得到所述至少一個視頻樣本中每個視頻樣本對應(yīng)的第一預(yù)測結(jié)果;
將至少一個圖片樣本中每個圖片樣本對應(yīng)的特征向量輸入至設(shè)定的圖片分類模型,得到所述至少一個圖片樣本中每個圖片樣本對應(yīng)的第二預(yù)測結(jié)果;其中,通過將圖片樣本輸入至所述視頻分類模型中的卷積層,得到圖片樣本對應(yīng)的特征向量;
基于至少兩個預(yù)測結(jié)果中每個預(yù)測結(jié)果與對應(yīng)的標定結(jié)果之間的差值,計算所述視頻分類模型的總損失值;所述至少兩個預(yù)測結(jié)果包括所述至少一個視頻樣本中每個視頻樣本對應(yīng)的第一預(yù)測結(jié)果和所述至少一個圖片樣本中每個圖片樣本對應(yīng)的第二預(yù)測結(jié)果;
根據(jù)所述總損失值更新所述視頻分類模型的權(quán)重參數(shù)。
2.根據(jù)權(quán)利要求1所述的視頻分類模型訓(xùn)練方法,其特征在于,所述基于至少兩個預(yù)測結(jié)果中每個預(yù)測結(jié)果與對應(yīng)的標定結(jié)果之間的差值,計算所述視頻分類模型的總損失值,包括:
基于所述至少一個視頻樣本中每個視頻樣本對應(yīng)的第一預(yù)測結(jié)果與對應(yīng)的標定結(jié)果之間的差值,計算第一損失值;
基于所述至少一個圖片樣本中每個圖片樣本對應(yīng)的第二預(yù)測結(jié)果與對應(yīng)的標定結(jié)果之間的差值,計算第二損失值;
基于所述第一損失值和所述第二損失值,計算所述視頻分類模型的總損失值。
3.根據(jù)權(quán)利要求2所述的視頻分類模型訓(xùn)練方法,其特征在于,所述基于所述第一損失值和所述第二損失值,計算所述視頻分類模型的總損失值,包括:
對所述第一損失值和所述第二損失值進行加權(quán)處理,得到所述視頻分類模型的總損失值;所述第一損失值對應(yīng)的第一權(quán)重值大于所述第二損失值對應(yīng)的第二權(quán)重值。
4.根據(jù)權(quán)利要求1至3任一項所述的視頻分類模型訓(xùn)練方法,其特征在于,還包括:
從樣本庫中隨機獲取至少一個批次的樣本;所述至少一個批次中的每個批次的樣本包括至少一個視頻樣本和至少一個圖片樣本。
5.根據(jù)權(quán)利要求4所述的視頻分類模型訓(xùn)練方法,其特征在于,所述至少一個批次中的每個批次的樣本均包括有分別對應(yīng)至少兩個不同的標定結(jié)果的樣本。
6.一種視頻分類方法,其特征在于,包括:
采用第一模型對視頻文件進行分類,得到分類結(jié)果;其中,
所述第一模型為采用如權(quán)利要求1至5任一項所述的視頻分類模型訓(xùn)練方法訓(xùn)練得到的視頻分類模型。
7.一種視頻分類模型訓(xùn)練裝置,其特征在于,包括:
第一處理單元,用于將至少一個視頻樣本輸入至視頻分類模型,得到所述至少一個視頻樣本中每個視頻樣本對應(yīng)的第一預(yù)測結(jié)果;
第二處理單元,用于將至少一個圖片樣本中每個圖片樣本對應(yīng)的特征向量輸入至設(shè)定的圖片分類模型,得到所述至少一個圖片樣本中每個圖片樣本對應(yīng)的第二預(yù)測結(jié)果;其中,通過將圖片樣本輸入至所述視頻分類模型中的卷積層,得到圖片樣本對應(yīng)的特征向量;
計算單元,用于基于至少兩個預(yù)測結(jié)果中每個預(yù)測結(jié)果與對應(yīng)的標定結(jié)果之間的差值,計算所述視頻分類模型的總損失值;所述至少兩個預(yù)測結(jié)果包括所述至少一個視頻樣本中每個視頻樣本對應(yīng)的第一預(yù)測結(jié)果和所述至少一個圖片樣本中每個圖片樣本對應(yīng)的第二預(yù)測結(jié)果;
更新單元,用于根據(jù)所述總損失值更新所述視頻分類模型的權(quán)重參數(shù)。
8.一種視頻分類裝置,其特征在于,包括:
分類單元,用于采用第一模型對視頻文件進行分類,得到分類結(jié)果;其中,
所述第一模型為采用如權(quán)利要求1至5任一項所述的視頻分類模型訓(xùn)練方法訓(xùn)練得到的視頻分類模型。
9.一種電子設(shè)備,其特征在于,包括:處理器和用于存儲能夠在處理器上運行的計算機程序的存儲器,
其中,所述處理器用于運行所述計算機程序時,執(zhí)行權(quán)利要求1至5任一項所述的視頻分類模型訓(xùn)練方法的步驟,或執(zhí)行權(quán)利要求6所述的視頻分類方法的步驟。
10.一種存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至5任一項所述的視頻分類模型訓(xùn)練方法的步驟,或?qū)崿F(xiàn)權(quán)利要求6所述的視頻分類方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于OPPO廣東移動通信有限公司,未經(jīng)OPPO廣東移動通信有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010737337.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





