[發明專利]一種視頻分類方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110029269.2 | 申請日: | 2021-01-11 |
| 公開(公告)號: | CN112765403A | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 遲至真;李思則;李巖 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06F16/75 | 分類號: | G06F16/75;G06F16/78;G06F16/783;G06F16/732 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 分類 方法 裝置 電子設備 存儲 介質 | ||
本公開公開了一種視頻分類方法、裝置、電子設備及存儲介質,用于解決對視頻標注標簽效率較低的問題。該方法包括:確定待分類的視頻;提取待分類的視頻的圖像特征,獲得待分類的視頻的圖像特征信息;提取待分類的視頻的音頻信號,并對音頻信號進行特征提取處理,獲得待分類的視頻的語音特征信息;對圖像特征信息和語音特征信息進行上下文轉換增強處理,獲得目標信息;對目標信息進行分類處理,獲得對應的多個類別信息和與類別信息對應的概率值,并將概率值大于預設閾值的類別信息對應的標簽確定為待分類的視頻的類別標簽。
技術領域
本公開涉及互聯網技術領域,尤其涉及一種視頻分類方法、裝置、電子設備及存儲介質。
背景技術
由于科技的不斷發展,生活工作節奏越來越快,因而播放時長在幾分鐘以內的視頻受到人們的喜愛和關注。
目前,視頻內容越來越豐富,僅僅依靠上傳視頻內容者在上傳時為視頻標注的類別標簽,可能存在類別分化不夠細致的問題,導致不能滿足用戶的精細化要求。并且,隨著視頻數量與內容的不斷增長,需要人工進行審核標注,然而人工的標注效率與視頻內容和數量的增長速度并不匹配,導致視頻不能及時且準確的呈現給用戶。
可見,相關技術中存在對視頻標注標簽效率較低的技術問題。
發明內容
本公開提供一種視頻分類方法、裝置、電子設備及存儲介質,用于解決相關技術中存在對視頻標注標簽效率較低的技術問題。本公開的技術方案如下:
根據本公開實施例的第一方面,提供一種視頻分類方法,所述方法包括:
確定待分類的視頻;
提取所述待分類的視頻的圖像特征,獲得所述待分類的視頻的圖像特征信息;以及提取所述待分類的視頻的音頻信號,并對所述音頻信號進行特征提取處理,獲得所述待分類的視頻的語音特征信息;
對所述圖像特征信息和所述語音特征信息進行上下文轉換增強處理,獲得目標信息,所述目標信息用于表征所述待分類視頻中每個幀圖像以及每個幀圖像與相鄰圖像所對應的信息;
對所述目標信息進行分類處理,獲得對應的多個類別信息和與所述類別信息對應的概率值,并將所述概率值大于預設閾值的類別信息對應的標簽確定為所述待分類的視頻的類別標簽。
在一種可能的實施方式中,通過訓練后的視頻分類模型提取所述待分類的視頻的圖像特征,獲得所述待分類的視頻的圖像特征信息,包括:
將所述待分類的視頻均勻劃分為固定段數的子視頻,并從每個子視頻中提取一幀圖像,獲得待處理幀圖像集;
對所述待處理幀圖像集中的幀圖像進行特征提取處理,獲得所述待分類的視頻的圖像特征信息。
在一種可能的實施方式中,若通過訓練后的視頻分類模型實現對所述待分類的視頻的分類,則所述訓練后的視頻分類模型通過以下方式訓練:
確定待訓練的數據集,其中,所述待訓練的數據集包括已標注標簽的視頻;
將所述待訓練的數據集中的視頻輸入待訓練的視頻分類模型中的預設空域子模型進行訓練,獲得訓練后的空域子模型;
通過所述訓練后的空域子模型,提取所述待訓練的數據集中的視頻的所有圖像特征,并將所述所有圖像特征輸入待訓練的視頻分類模型中的預設時域子模型進行訓練,獲得訓練后的時域子模型;
將輸入所述訓練后的時域子模型和所述訓練后的空域子模型后所獲得的信息,輸入待訓練的視頻分類模型中的預設局部聚集子模型進行訓練,獲得訓練后的視頻分類模型。
在一種可能的實施方式中,確定待訓練的數據集,包括:
確定可用的實體標簽詞語集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110029269.2/2.html,轉載請聲明來源鉆瓜專利網。





