[發明專利]一種針對直播場景視頻的內容審核模型訓練方法及裝置在審
| 申請號: | 201811147396.7 | 申請日: | 2018-09-29 |
| 公開(公告)號: | CN109284784A | 公開(公告)日: | 2019-01-29 |
| 發明(設計)人: | 曹騰;唐會軍;劉拴林;陳云闊 | 申請(專利權)人: | 北京數美時代科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 楊立;陳振玉 |
| 地址: | 100012 北京市朝陽區望*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 內容審核 場景視頻 人工標注 相似度 標簽 模型訓練 直播 標注 圖片 視頻信息 圖片確定 相鄰兩幀 學習算法 準確率 預設 需求量 審核 | ||
本發明涉及視頻信息技術領域,尤其涉及一種針對直播場景視頻的內容審核模型訓練方法及裝置,方法包括:通過深度學習算法訓練獲取的人工標注樣本,得到初步模型;計算當前直播場景視頻中相鄰兩幀圖片的相似度,將相似度大于預設相似度的兩幀圖片確定為相似圖片,并對相似圖片標注相同的標簽;利用初步模塊對獲取的大量未標注樣本進行識別,得到標簽樣本;根據人工標注樣本、相似圖片的標簽和標簽樣本,訓練得到內容審核模型。通過本發明的方法得到的內容審核模型準確率高,審核效果好,而且大大的減少了人工標注樣本的需求量,有效的降低成本。
技術領域
本發明涉及視頻信息技術領域,尤其涉及一種針對直播場景視頻的內容審核模型訓練方法及裝置。
背景技術
直播場景存在內容安全風險,現有技術一般是利用內容審核模型過濾視頻畫面,或同時配合審核專員對直播視頻進行攔截。其中,內容審核模型的準確率及召回率對內容審核而言十分重要,然而內容審核模型審核效果的好壞依賴于海量的訓練樣本,需要大量(通常是百萬數量級)的人工標注樣本。
發明內容
本發明所要解決的技術問題是針對現有技術的不足,提供一種針對直播場景視頻的內容審核模型訓練方法及裝置。
本發明解決上述技術問題的技術方案如下:一種針對直播場景視頻的內容審核模型訓練方法,包括:
通過深度學習算法訓練獲取的人工標注樣本,得到初步模型;
計算當前直播場景視頻中相鄰兩幀圖片的相似度,將相似度大于預設相似度的兩幀圖片確定為相似圖片,并對所述相似圖片標注相同的標簽;
利用所述初步模塊對獲取的大量未標注樣本進行識別,得到標簽樣本;
根據所述人工標注樣本、所述相似圖片的標簽和所述標簽樣本,訓練得到內容審核模型。
本發明的有益效果是:利用通過深度學習算法訓練人工標注樣本得到的初步模型對大量的未標注樣本進行識別,得到標簽樣本,且利用相似度從當前直播場景視頻中得到相似圖片,并對相似圖片標注相同的標簽,以便基于人工標注樣本、相似圖片的標簽和標簽樣本,快速訓練得到內容審核模型,通過該方法得到的內容審核模型準確率高,審核效果好,而且大大的減少了人工標注樣本的需求量,有效的降低成本。
在上述技術方案的基礎上,本發明還可以做如下改進。
進一步地,根據所述人工標注樣本、所述相似圖片的標簽和所述標簽樣本,訓練得到內容審核模型,包括:
通過深度學習算法訓練所述人工標注樣本、所述相似圖片的標簽和所述標簽樣本,得到所述內容審核模型。
采用上述進一步方案的有益效果是:采用深度學習算法訓練人工標注樣本、相似圖片的標簽和標簽樣本,可以更加快速的得到內容審核模型。
進一步地,利用所述初步模塊對獲取的大量未標注樣本進行識別,得到標簽樣本,包括:
利用所述初步模塊對獲取的大量未標注樣本進行識別,得到多個中間樣本,每個所述中間樣本具有標簽和與所述標簽對應的置信度;
將多個所述中間樣本中標簽的置信度滿足預定條件的中間樣本確定為所述標簽樣本。
采用上述進一步方案的有益效果是:通過從利用初步模塊對大量未標注樣本進行識別得到的多個中間樣本中,選擇標簽的置信度滿足預定調節的中間樣本作為標簽樣本,可以使得訓練得到的內容審核模型更加準確。
進一步地,所述未標注樣本的數量遠大于所述人工標注樣本的數量,所述標簽包括:正常、色情、暴恐和涉政四類。
本發明為了解決上述技術問題還提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時,實現上述任一項實施例中的針對直播場景視頻的內容審核模型訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京數美時代科技有限公司,未經北京數美時代科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811147396.7/2.html,轉載請聲明來源鉆瓜專利網。





