[發明專利]用于生成模型的方法和裝置有效
| 申請號: | 201811273468.2 | 申請日: | 2018-10-30 |
| 公開(公告)號: | CN109344908B | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 袁澤寰;王長虎 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 生成 模型 方法 裝置 | ||
本申請實施例公開了用于生成模型方法和裝置。該方法的一具體實施方式包括:獲取樣本集;從該樣本集中提取樣本,執行如下訓練步驟:將所提取的樣本中的樣本視頻中的幀輸入至初始模型,分別得到樣本視頻屬于低質視頻和各低質類別的概率;基于所提取的樣本中的標注信息、所得到的概率和預先建立的損失函數,確定樣本的損失值;基于該損失值與目標值的比較,確定初始模型是否訓練完成;響應于確定初始模型訓練完成,將訓練后的初始模型確定為低質視頻檢測模型。該實施方式能夠得到一種可以用于低質視頻檢測的模型,該模型有助于提高對低質視頻檢測的效率。
技術領域
本申請實施例涉及計算機技術領域,具體涉及用于生成模型的方法和裝置。
背景技術
隨著計算機技術的發展,短視頻類應用應運而生。用戶可以利用短視頻類應用上傳、發布視頻。服務器在接收到一個視頻后,可以對該視頻進行檢測,以確定其是否為低質視頻。此處,低質視頻通常為質量較低的視頻,例如,可以包括模糊視頻、黑屏視頻、錄屏視頻等。
相關的方式,通常是將視頻分為多類,例如分為黑屏視頻類、錄屏視頻類、模糊視頻類、正常視頻類。訓練分類模型確定視頻屬于各個類別的概率,將視頻屬于非正常視頻的概率之和作為視頻屬于低質視頻的概率,進而確定視頻是否為低質視頻。
發明內容
本申請實施例提出了用于生成模型的方法和裝置。
第一方面,本申請實施例提供了一種用于生成模型的方法,該方法包括:獲取樣本集,其中,該樣本集中的樣本包括樣本視頻和用于指示樣本視頻是否屬于低質視頻的第一標注信息,當樣本視頻屬于低質視頻時,樣本還包括用于指示樣本視頻的低質類別的第二標注信息;從樣本集中提取樣本,執行如下訓練步驟:將所提取的樣本中的樣本視頻中的幀輸入至初始模型,分別得到樣本視頻屬于低質視頻和各低質類別的概率;基于所提取的樣本中的標注信息、所得到的概率和預先建立的損失函數,確定樣本的損失值;基于損失值與目標值的比較,確定初始模型是否訓練完成;響應于確定初始模型訓練完成,將訓練后的初始模型確定為低質視頻檢測模型。
在一些實施例中,基于所提取的樣本中的標注信息、所得到的概率和預先建立的損失函數,確定樣本的損失值,包括:將所提取的樣本中的第一標注信息、樣本視頻屬于低質視頻的概率輸入至預先建立的第一損失函數,得到第一損失值;響應于確定所提取的樣本中不包含第二標注信息,將第一損失值確定為所提取的樣本的損失值。
在一些實施例中,基于所提取的樣本中的標注信息、所得到的概率和預先建立的損失函數,確定樣本的損失值,還包括:響應于確定所提取的樣本中包含第二標注信息,將所提取的樣本中的第二標注信息所指示的低質類別作為目標類別,將所提取的樣本中所包含的第二標注信息、樣本視頻屬于目標類別的概率輸入至預先建立的第二損失函數,得到第二損失值;將第一損失值與第二損失值之和確定為所提取的樣本的損失值。
在一些實施例中,該方法還包括:響應于確定初始模型未訓練完成,基于所確定的損失值,更新初始模型中的參數,從樣本集中重新提取樣本,使用更新參數后的初始模型作為初始模型,繼續執行訓練步驟。
第二方面,本申請實施例提供了一種用于生成模型的裝置,該裝置包括:獲取單元,被配置成獲取樣本集,其中,樣本集中的樣本包括樣本視頻和用于指示樣本視頻是否屬于低質視頻的第一標注信息,當樣本視頻屬于低質視頻時,樣本還包括用于指示樣本視頻的低質類別的第二標注信息;訓練單元,被配置成從樣本集中提取樣本,執行如下訓練步驟:將所提取的樣本中的樣本視頻的幀輸入至初始模型,分別得到樣本視頻屬于低質視頻和各低質類別的概率;基于所提取的樣本中的標注信息、所得到的概率和預先建立的損失函數,確定樣本的損失值;基于損失值與目標值的比較,確定初始模型是否訓練完成;響應于確定初始模型訓練完成,將訓練后的初始模型確定為低質視頻檢測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811273468.2/2.html,轉載請聲明來源鉆瓜專利網。





