[發明專利]用于生成分類模型的方法和裝置有效
| 申請號: | 201910204092.8 | 申請日: | 2019-03-18 |
| 公開(公告)號: | CN109961032B | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 李偉健;王長虎 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/774;G06V10/764;G06K9/62 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 分類 模型 方法 裝置 | ||
1.一種用于生成分類模型的方法,包括:
獲取樣本集合,其中,所述樣本集合中的樣本具有相應的類別信息,該類別信息用于表征該樣本為正樣本或負樣本,所述樣本集合包括視頻樣本集合;
從所述樣本集合中選擇樣本,其中,所選擇的樣本為視頻樣本;
基于所選擇的樣本的類別信息確定所選擇的樣本是否為正樣本;響應于確定所選擇的樣本為正樣本,通過將所選擇的樣本作為所述分類模型的輸入,并將所選擇的樣本的類別信息作為所述分類模型的期望輸出,利用第一損失函數來調整所述分類模型的參數,包括:從所選擇的視頻樣本中提取樣本視頻幀集合;從所提取的樣本視頻幀集合提取特征數據;基于所提取的特征數據和所選擇的視頻樣本的類別信息,利用所述第一損失函數,調整所述分類模型的參數,所述第一損失函數包括多分類損失函數;
響應于確定所選擇的樣本為負樣本,通過將所選擇的樣本作為所述分類模型的輸入,并將所選擇的樣本的類別信息作為所述分類模型的期望輸出,利用第二損失函數來調整所述分類模型的參數,其中,所述第二損失函數包括二分類損失函數,所述分類模型包括的分類層包括多個二分類器和一個多分類器,每個二分類器對應于一個類別信息,在使用所述第一損失函數或所述第二損失函數進行訓練時,二分類器和多分類器的參數同時優化。
2.根據權利要求1所述的方法,其中,所述樣本集合中的樣本的類別信息由具有預設數目的元素的向量來表示,所述預設數目的元素中的元素對應于多個預設類別中的類別。
3.根據權利要求1所述的方法,其中,從所選擇的視頻樣本中提取樣本視頻幀集合,包括以下至少一項:
從所選擇的視頻樣本中,提取關鍵幀的集合,作為所述樣本視頻幀集合;
基于預設的播放時間間隔從所選擇的視頻樣本中提取所述樣本視頻幀集合。
4.根據權利要求1所述的方法,其中,通過將所選擇的樣本作為所述分類模型的輸入,并將所選擇的樣本的類別信息作為所述分類模型的期望輸出,利用第二損失函數來調整所述分類模型的參數,包括:
從所選擇的視頻樣本中提取樣本視頻幀集合;
從所提取的樣本視頻幀集合提取特征數據;
基于所提取的特征數據和所選擇的視頻樣本的類別信息,利用所述第二損失函數,調整所述分類模型的參數。
5.一種視頻分類方法,包括:
獲取待分類視頻;
將所述待分類視頻輸入預先訓練的分類模型,以生成用于表征所述待分類視頻所屬的視頻類別的類別信息,其中,所述分類模型是根據上述權利要求1-4之一所述的方法生成的。
6.根據權利要求5所述的方法,其中,所述方法還包括:
將所述待分類視頻發送至與所述類別信息表征的視頻類別建立對應關系的用戶的終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910204092.8/1.html,轉載請聲明來源鉆瓜專利網。





