[發明專利]用于生成分類模型的方法和裝置有效
| 申請號: | 201910204092.8 | 申請日: | 2019-03-18 |
| 公開(公告)號: | CN109961032B | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 李偉健;王長虎 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/774;G06V10/764;G06K9/62 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 分類 模型 方法 裝置 | ||
本公開的實施例公開了用于生成分類模型的方法和裝置。該方法的一具體實施方式包括:獲取樣本集合;從樣本集合中選擇樣本;基于所選擇的樣本的類別信息確定所選擇的樣本是否為正樣本;如果為正樣本,利用第一損失函數來調整分類模型的參數;如果為負樣本,利用第二損失函數來調整分類模型的參數。該實施方式可以有針對性地利用不同類型的樣本視頻對模型進行優化,從而有助于提高訓練得到的分類模型對視頻進行分類的準確性,減少對訓練樣本的需求量,提高模型訓練的效率。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及用于生成分類模型的方法和裝置。
背景技術
目前,為了識別視頻、圖像等信息的類別,可以使用分類模型。分類模型通常需要預先訓練得到。現有的分類模型通常為多分類模型,即可以將輸入的視頻劃歸到預設的多個類別中的其中一個。為了提高多分類模型對視頻分類的準確率,通常需要針對每個類別,設置大量的訓練樣本以供訓練時對模型的參數進行優化。
發明內容
本公開的實施例提出了用于生成分類模型的方法和裝置,以及視頻分類方法和裝置。
第一方面,本公開的實施例提供了一種用于生成分類模型的方法,該方法包括:獲取樣本集合,其中,樣本集合中的樣本具有相應的類別信息,該類別信息用于表征該樣本為正樣本或負樣本;從樣本集合中選擇樣本;基于所選擇的樣本的類別信息確定所選擇的樣本是否為正樣本;響應于確定所選擇的樣本為正樣本,通過將所選擇的樣本作為分類模型的輸入,并將所選擇的樣本的類別信息作為分類模型的期望輸出,利用第一損失函數來調整分類模型的參數;響應于確定所選擇的樣本為負樣本,通過將所選擇的樣本作為分類模型的輸入,并將所選擇的樣本的類別信息作為分類模型的期望輸出,利用第二損失函數來調整分類模型的參數。
在一些實施例中,第一損失函數包括多分類損失函數,并且第二損失函數包括二分類損失函數。
在一些實施例中,樣本集合中的樣本的類別信息由具有預設數目的元素的向量來表示,預設數目的元素中的元素對應于多個預設類別中的類別。
在一些實施例中,樣本集合包括視頻樣本集合,所選擇的樣本為視頻樣本;以及通過將所選擇的樣本作為分類模型的輸入,并將所選擇的樣本的類別信息作為分類模型的期望輸出,利用第一損失函數來調整分類模型的參數,包括:從所選擇的視頻樣本中提取樣本視頻幀集合;從所提取的樣本視頻幀集合提取特征數據;基于所提取的特征數據和所選擇的視頻樣本的類別信息,利用第一損失函數,調整分類模型的參數。
在一些實施例中,從所選擇的視頻樣本中提取樣本視頻幀集合,包括以下至少一項:從所選擇的視頻樣本中,提取關鍵幀的集合,作為樣本視頻幀集合;基于預設的播放時間間隔從所選擇的視頻樣本中提取樣本視頻幀集合。
在一些實施例中,通過將所選擇的樣本作為分類模型的輸入,并將所選擇的樣本的類別信息作為分類模型的期望輸出,利用第二損失函數來調整分類模型的參數,包括:從所選擇的視頻樣本中提取樣本視頻幀集合;從所提取的樣本視頻幀集合提取特征數據;基于所提取的特征數據和所選擇的視頻樣本的類別信息,利用第二損失函數,調整分類模型的參數。
第二方面,本公開的實施例提供了一種視頻分類方法,該方法包括:獲取待分類視頻;將待分類視頻輸入預先訓練的分類模型,以生成用于表征待分類視頻所屬的視頻類別的類別信息,其中,分類模型是根據上述第一方面中任一實施例描述的方法生成的。
在一些實施例中,該方法還包括:將待分類視頻發送至與類別信息表征的視頻類別建立對應關系的用戶的終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910204092.8/2.html,轉載請聲明來源鉆瓜專利網。





