[發明專利]一種視頻分類方法和裝置有效
| 申請號: | 201910516934.3 | 申請日: | 2019-06-14 |
| 公開(公告)號: | CN110222234B | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 谷滿昌;張弛;陳相男 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F16/75 | 分類號: | G06F16/75;G06F16/78;G06F16/783;G06K9/00;G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 分類 方法 裝置 | ||
1.一種視頻分類方法,其特征在于,包括:
獲取待分類視頻的標題數據和封面圖;
對所述標題數據進行切分生成特征詞,并將所述特征詞輸入寬度網絡模型得到第一分類結果;
將所述標題數據轉換成深度網絡的輸入樣本;
將所述輸入樣本輸入所述深度網絡得到第二分類結果;
將所述封面圖進行特征提取得到特征數據;
將所述特征數據輸入所述深度網絡得到第三分類結果;
根據所述第一分類結果、第二分類結果以及所述第三分類結果確定目標分類結果。
2.根據權利要求 1 所述的方法,其特征在于,所述將所述輸入樣本輸入所述深度網絡得到第二分類結果包括:
將所述輸入樣本依次進行特征提取和特征壓縮得到語義表示向量;
通過注意力機制激活所述語義表示向量中的預設部分從而得到文本表示向量;
對所述文本表示向量進行 softmax 分類得到所述第二分類結果。
3.根據權利要求 1 所述的方法,其特征在于,所述將所述特征數據輸入所述深度網絡得到第三分類結果包括:
將所述特征數據依次通過至少兩個前饋神經網絡后進行 softmax 分類得到所述第三分類結果。
4.根據權利要求 1 至 3 中任一項所述的方法,其特征在于,所述對所述標題數據進行切分生成特征詞包括:
去除所述標題數據中的非文本數據,得到文本數據;
統一所述文本數據的格式,并按照預設長度生成待識別文本數據;對所述待識別文本數據進行切分生成 n 元模子特征,所述 n 元模子特征作為所述特征詞;
所述將所述標題數據轉換成深度網絡的輸入樣本包括:
去除所述標題數據中的非文本數據,得到文本數據;
統一所述文本數據的格式,并按照預設長度生成所述待識別文本數據;將所述待識別文本數據轉換成深度網絡的輸入樣本。
5.根據權利要求 4 所述的方法,其特征在于,所述對所述待識別文本數據進行切分生成 n 元模子特征包括:
對所述待識別文本數據進行分詞得到連續字串;
對預設長度為 n 的連續字串進行統計提取得到所述 n 元模子特征。
6.根據權利要求 4 所述的方法,其特征在于,所述將所述待識別文本數據轉換成深度網絡的輸入樣本包括:
對所述待識別文本數據采用詞嵌入的方法轉換成所述深度網絡的輸入樣本。
7.一種視頻分類裝置,其特征在于,包括:
獲取模塊,用于獲取待分類視頻的標題數據和封面圖;
處理模塊,用于對所述標題數據進行切分生成特征詞,并將所述特征詞輸入寬度網絡模型得到第一分類結果;將所述標題數據轉換成深度網絡的輸入樣本;將所述輸入樣本輸入所述深度網絡得到第二分類結果;將所述封面圖進行特征提取得到特征數據;將所述特征數據輸入所述深度網絡得到第三分類結果;根據所述第一分類結果、第二分類結果以及所述第三分類結果確定目標分類結果。
8.一種視頻分類裝置,其特征在于,包括:處理器和存儲器,其中,所述存儲器中存有計算機可讀程序,所述處理器通過運行所述存儲器中的程序,以用于完成權利要求 1 至 6中任一項所述的方法。
9.一種計算機可讀存儲介質,所述計算機存儲介質存儲有計算機指令,所述計算機指令用于執行權利要求 1 至 6 中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910516934.3/1.html,轉載請聲明來源鉆瓜專利網。





