[發明專利]視頻處理方法和裝置在審
| 申請號: | 202010906983.0 | 申請日: | 2020-08-31 |
| 公開(公告)號: | CN112000842A | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 高永強 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F16/75 | 分類號: | G06F16/75;G06K9/62;G06N3/02;G06N3/08 |
| 代理公司: | 北京海智友知識產權代理事務所(普通合伙) 11455 | 代理人: | 吳京順 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 處理 方法 裝置 | ||
1.一種視頻處理方法,包括:
獲取待分類視頻;
確定所述待分類視頻包括的所有預設時長片段的預設分類信息;
根據所述待分類視頻包括的所有預設時長片段的預設分類信息,確定所述待分類視頻的分類結果。
2.根據權利要求1所述的方法,其中,所述確定所述待分類視頻包括的所有預設時長片段的預設分類信息,包括:
對所述待分類視頻進行分割,獲取所述待分類視頻的所有預設時長片段,基于對預設時長片段的內容理解,確定預設時長片段的預設分類信息。
3.根據權利要求1所述的方法,其中,所述確定所述待分類視頻包括的所有預設時長片段的預設分類信息,包括:
將所述待分類視頻輸入預先訓練的視頻分類模型,針對于所述待分類視頻包括的所有預設時長片段中的每個預設時長片段,通過所述視頻分類模型中的目標全連接層得到表征該預設時長片段的預設分類信息的特征向量;以及
所述根據所述待分類視頻包括的所有預設時長片段的預設分類信息,確定所述待分類視頻的分類結果,包括:
根據所述待分類視頻包括的每個預設時長片段對應的特征向量,通過所述視頻分類模型中連接所述目標全連接層的柔性最大化層確定所述待分類視頻的分類結果,其中,所述視頻分類模型用于表征待分類視頻與分類結果之間的對應關系。
4.根據權利要求3所述的方法,其中,所述根據所述待分類視頻包括的每個預設時長片段對應的特征向量,通過所述視頻分類模型中連接所述目標全連接層的柔性最大化層確定所述待分類視頻的分類結果,包括:
針對于所述待分類視頻包括的每個預設時長片段對應的特征向量,進行最大池化;
將進行最大池化后的每個特征向量輸入所述柔性最大化層,確定所述待分類視頻的分類結果。
5.根據權利要求1所述的方法,其中,所述視頻分類模型是以殘差神經網絡為主干網絡的時間轉移模型。
6.根據權利要求1所述的方法,其中,所述視頻分類模型通過如下方式訓練得到:
獲取訓練樣本集,其中,所述訓練樣本集中的訓練樣本包括樣本視頻、樣本視頻包括的所有樣本視頻片段的預設分類信息以及樣本視頻的分類結果;
采用機器學習算法,以訓練樣本中的樣本視頻作為初始視頻分類模型的輸入,以輸入的樣本視頻包括的所有樣本視頻片段中的每個樣本視頻片段的預設分類信息,依次作為初始視頻分類模型中的目標全連接層的期望輸出,以輸入的樣本視頻的分類結果作為初始視頻分類模型中連接所述目標全連接層的柔性最大化層的期望輸出,訓練得到所述視頻分類模型。
7.根據權利要求6所述的方法,其中,所述視頻分類模型采用對稱交叉熵函數,其中,所述對稱交叉熵函數通過交叉熵函數和反向交叉熵函數得到。
8.根據權利要求1-7任一所述的方法,其中,所述待分類視頻的分類結果包括所述待分類視頻屬于各預設分類信息的概率,以及各預設分類信息所對應的預設時長片段的數量。
9.一種視頻處理裝置,包括:
獲取單元,被配置成獲取待分類視頻;
確定單元,被配置成確定所述待分類視頻包括的所有預設時長片段的預設分類信息;
分類單元,被配置成根據所述待分類視頻包括的所有預設時長片段的預設分類信息,確定所述待分類視頻的分類結果。
10.一種服務器,包括:
一個或多個處理器;
存儲裝置,其上存儲有一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-8中任一所述的方法。
11.一種計算機可讀介質,其上存儲有計算機程序,其中,該程序被處理器執行時實現如權利要求1-8中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010906983.0/1.html,轉載請聲明來源鉆瓜專利網。





