[發(fā)明專利]多標簽視頻分類方法、模型訓練方法、裝置及介質在審
| 申請?zhí)枺?/td> | 202010820972.0 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN111898703A | 公開(公告)日: | 2020-11-06 |
| 發(fā)明(設計)人: | 王子愉;姜文浩;劉威 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 李娟 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標簽 視頻 分類 方法 模型 訓練 裝置 介質 | ||
本申請?zhí)峁┮环N多標簽視頻分類方法、模型訓練方法、裝置及介質,涉及人工智能技術領域,該模型訓練方法用于減少訓練視頻分類模型過程中的計算量。該分類視頻模型包括特征構造模塊和分類模塊,特征構造模塊的參數矩陣的秩和分類模塊的參數矩陣的秩均小于樣本每個樣本視頻幀的樣本特征向量的維度,利用特征構造模塊確定樣本特征矩陣中與視頻標簽分類相關的特征,獲得第一特征矩陣;利用各視頻標簽對應的分類模塊確定第一特征矩陣與視頻標簽的相關度,獲得屬于各視頻標簽的概率;調整特征構造模塊的參數矩陣,和每個視頻標簽對應的分類模塊的參數矩陣,直至各視頻標簽對應的視頻分類模型收斂,獲得各視頻標簽的已訓練的視頻分類模型。
技術領域
本申請涉及計算機技術領域,尤其涉及人工智能技術領域,提供一種多標簽視頻分類方法、模型訓練方法、裝置及介質。
背景技術
為了便于用戶查找自己想要觀看的視頻,目前大多數視頻播放平臺都會為各視頻進行分類,比如按照視頻標簽庫中的視頻標簽對視頻進行分類。
目前,對視頻分類的方法是提取視頻的雙線性池化特征,通過網絡對雙線性池化特征進行分類,獲得視頻對應的視頻標簽,但視頻的雙線性池化特征較多,導致訓練網絡過程中的計算量較大。
發(fā)明內容
本申請實施例提供一種多標簽視頻分類方法、模型訓練方法、裝置及介質,用于減少訓練視頻分類模型過程中的計算量。
一方面,提供了一種多標簽視頻分類模型訓練方法,應用于訓練每個視頻標簽對應的視頻分類模型,每個視頻標簽對應的視頻分類模型包括特征構造模塊和分類模塊,所述方法包括:
提取樣本視頻的樣本特征矩陣;其中,所述樣本視頻標注了所屬的真實視頻標簽,所述樣本特征矩陣包括所述樣本視頻的多個樣本視頻幀中各樣本視頻幀的樣本特征向量,所述特征構造模塊的參數矩陣的秩和所述分類模塊的參數矩陣的秩均小于樣本視頻幀的樣本特征的維度;
通過所述特征構造模塊,確定所述樣本特征矩陣中與視頻標簽分類相關的特征,獲得第一特征矩陣;
分別通過每個視頻標簽對應的分類模塊,確定所述第一特征矩陣與視頻標簽的相關度,獲得所述樣本視頻屬于每個視頻標簽的概率;
根據所述樣本視頻屬于每個視頻標簽的概率,以及所述樣本視頻所屬的真實視頻標簽,調整所述特征構造模塊的參數矩陣,以及每個視頻標簽對應的分類模塊的參數矩陣,直至所述每個視頻標簽對應的視頻分類模型收斂,獲得每個視頻標簽對應的已訓練的視頻分類模型。
又一方面,提供一種多標簽視頻分類方法,包括:
提取待處理視頻的目標特征矩陣;其中,所述目標特征矩陣包括所述待處理視頻的多個目標視頻幀中各目標視頻幀的目標特征向量;
通過特征構造模塊,確定所述目標特征矩陣中與視頻標簽分類相關的特征,獲得第四特征矩陣;
分別通過每個視頻標簽對應視頻標簽分類模型中的分類模塊,獲得所述第四特征矩陣與視頻標簽的相關度,獲得所述待處理視頻屬于每個視頻標簽的概率;其中,每個視頻標簽對應的視頻分類模型包括所述特征構造模塊和視頻標簽對應的分類模塊,所述特征構造模塊的參數矩陣的秩和分類模塊的參數矩陣的秩均小于所述目標視頻幀的目標特征向量的維度;
根據所述待處理視頻屬于每個視頻標簽的概率,確定所述待處理視頻所屬的視頻標簽。
在本申請實施例,提供一種多標簽視頻分類模型訓練裝置,所述裝置用于訓練每個視頻標簽對應的視頻分類識別模型,每個視頻標簽對應的視頻分類識別模型包括特征構造模塊和分類模塊,所述裝置包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010820972.0/2.html,轉載請聲明來源鉆瓜專利網。





