[發明專利]一種視頻處理方法和裝置在審
| 申請號: | 202010235566.8 | 申請日: | 2020-03-30 |
| 公開(公告)號: | CN111476131A | 公開(公告)日: | 2020-07-31 |
| 發明(設計)人: | 耿煥;何楠;林星;白興安;徐揚 | 申請(專利權)人: | 北京微播易科技股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京瀚群律師事務所 11581 | 代理人: | 王姍姍 |
| 地址: | 100000 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 處理 方法 裝置 | ||
本發明公開了一種視頻處理方法和裝置,涉及圖像處理技術。為解決現有技術采用人工或傳統機器學習方式需要耗費大量的人力物力,且效率較低的問題而發明。本發明實施例提供的技術方案包括:獲取待分類視頻的多個關鍵幀圖像;通過預先訓練的分類模型對所述多個關鍵幀圖像進行處理,得到所述待分類視頻的分類結果;所述預先訓練的分類模型中包括由預設注意力模塊嵌入到SENet網絡中生成的改進模塊。該方案可以應用在視頻推薦、搜索等領域。
技術領域
本發明涉及圖像處理技術,尤其涉及一種視頻處理方法和裝置。
背景技術
視頻分類是對視頻內容進行分析理解以識別其語義類別的技術,在互聯網監測、人機交互等方面具有廣闊的應用前景,長期以來受到業界的廣泛關注。
現有技術中,大多數視頻分類都是基于人工設計和傳統機器學習方法實現的。然而采用人工或傳統機器學習方式需要耗費大量的人力物力,且效率較低。
發明內容
本發明提供一種視頻處理方法和裝置,能夠提高視頻分類的效率。
一方面,本發明一種視頻處理方法,包括:獲取待分類視頻的多個關鍵幀圖像;通過預先訓練的分類模型對所述多個關鍵幀圖像進行處理,得到所述待分類視頻的分類結果;所述預先訓練的分類模型中包括由預設注意力模塊嵌入到SENet網絡中生成的改進模塊。
再一方面,本發明實施例提供一種視頻處理裝置,包括:
圖像獲取單元,用于獲取待分類視頻的多個關鍵幀圖像;
分類單元,與所述圖像獲取單元相連,用于通過預先訓練的分類模型對所述多個關鍵幀圖像進行處理,得到所述待分類視頻的分類結果;所述預先訓練的分類模型中包括由預設注意力模塊嵌入到SENet網絡中生成的改進模塊。
本發明實施例提供的技術方案,通過預先訓練的分類模型對待分類視頻對應的多個關鍵幀圖像進行處理得到待分類視頻的分類結果,從而實現了待分類視頻的處理。本發明實施例提供的技術方案,僅獲取待分類視頻的多個關鍵幀圖像,減少了處理參數的數量;而且,利用分類模型對多個關鍵幀圖像進行處理,能夠統一不同幀之間的信息,減少了對計算資源的浪費。該方案解決了現有技術中采用人工或傳統機器學習方式需要耗費大量的人力物力,且效率較低的問題。此外,由于預先訓練的分類模型中包括改進模塊,而改進模塊是由預設注意力模塊嵌入到SENet網絡中生成的,通過將預設注意力模塊嵌入SENet網絡,能夠進一步提高視頻分類的準確率。
附圖說明
圖1為本發明實施例1提供的視頻處理方法的流程圖;
圖2為本發明實施例2提供的視頻處理方法的示意圖;
圖3為圖2所示的視頻處理方法中嵌入過程的流程圖;
圖4為本發明實施例3提供的視頻處理裝置的結構示意圖一;
圖5為本發明實施例3提供的視頻處理裝置的結構示意圖二;
圖6為圖4所示的視頻處理裝置中模型改進單元的結構示意圖;
圖7為圖4所示的視頻處理裝置中模型訓練單元的結構示意圖;
圖8為圖7所示的模型訓練單元中視頻分類模塊的結構示意圖;
圖9為圖4所示的視頻處理裝置中分類單元的結構示意圖。
具體實施方式
下面結合實施例及附圖對本發明的技術方案作進一步闡述。
實施例1
如圖1所示,本發明實施例提供一種視頻處理方法,包括:
步驟101,獲取待分類視頻的多個關鍵幀圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京微播易科技股份有限公司,未經北京微播易科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010235566.8/2.html,轉載請聲明來源鉆瓜專利網。





