[發明專利]用于處理視頻的方法和裝置在審
| 申請號: | 201910084731.1 | 申請日: | 2019-01-29 |
| 公開(公告)號: | CN109815365A | 公開(公告)日: | 2019-05-28 |
| 發明(設計)人: | 李偉健;王長虎 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F16/73 | 分類號: | G06F16/73;G06K9/00;G06K9/62 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 類別信息 標注 視頻 方法和裝置 概率 集合 隊列建立 機器識別 人工標注 視頻存儲 視頻分類 視頻輸入 預先建立 預設 隊列 終端 注視 | ||
本公開的實施例公開了用于處理視頻的方法和裝置。該方法的一具體實施方式包括:獲取待標注視頻;將待標注視頻輸入預先訓練的視頻分類模型,得到類別信息集合和類別信息對應的概率值,其中,類別信息用于表征待標注視頻所屬的類別;從類別信息集合中選擇類別信息,其中,所選擇的類別信息對應的概率值大于等于預設的概率閾值;對于所選擇的類別信息中的類別信息,將待標注視頻存儲到與該類別信息預先建立對應關系的標注隊列中,以使待標注視頻發送到預先與標注隊列建立對應關系的標注終端。該實施方式實現了將機器識別和人工標注相結合,有助于提高對視頻進行標注的準確性和效率。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及用于處理視頻的方法和裝置。
背景技術
隨著互聯網技術的發展,越來越多的視頻出現在互聯網中。為了便于對這些視頻進行管理,可以使用視頻分類模型,對視頻進行類型識別。為了訓練視頻分類模型,通常需要對大量的樣本視頻進行標注,以區分樣本視頻的類型。目前主要由人工對視頻進行標注。
發明內容
本公開的實施例提出了用于處理視頻的方法和裝置。
第一方面,本公開的實施例提供了一種用于處理視頻的方法,該方法包括:獲取待標注視頻;將待標注視頻輸入預先訓練的視頻分類模型,得到類別信息集合和類別信息對應的概率值,其中,類別信息用于表征待標注視頻所屬的類別;從類別信息集合中選擇類別信息,其中,所選擇的類別信息對應的概率值大于等于預設的概率閾值;對于所選擇的類別信息中的類別信息,將待標注視頻存儲到與該類別信息預先建立對應關系的標注隊列中,以使待標注視頻發送到預先與標注隊列建立對應關系的標注終端。
在一些實施例中,從類別信息集合中選擇類別信息,包括:響應于確定類別信息集合包括的、對應的概率值大于等于預設的概率閾值的類別信息的數量大于預設數量,從對應的概率值大于等于預設的概率閾值的類別信息中選擇預設數量個類別信息。
在一些實施例中,從類別信息集合中選擇類別信息,包括:響應于確定類別信息集合包括的、對應的概率值大于等于預設的概率閾值的類別信息的數量小于等于預設數量,選擇對應的概率值大于等于預設的概率閾值的類別信息。
在一些實施例中,視頻分類模型預先按照如下步驟訓練得到:獲取訓練樣本集合,其中,訓練樣本包括樣本視頻、預先對樣本視頻進行標注的樣本類別信息集合;利用機器學習方法,將訓練樣本集合中的訓練樣本包括的樣本視頻作為輸入,將與輸入的樣本視頻對應的樣本類別信息集合作為期望輸出,訓練得到視頻分類模型。
在一些實施例中,視頻分類模型為多標簽分類模型。
在一些實施例中,在對于所選擇的類別信息中的類別信息,將待標注視頻存儲到與該類別信息預先建立對應關系的標注隊列中,以使待標注視頻發送到預先與標注隊列建立對應關系的標注終端之后,該方法還包括:獲取標注后視頻集合,其中,標注后視頻是由標注終端對接收的待標注視頻進行類別信息標注后得到的視頻;利用機器學習方法,將標注后視頻集合中的標注后視頻作為視頻分類模型的輸入,將與輸入的標注后視頻對應的類別信息集合作為視頻分類模型的期望輸出,訓練得到更新后的視頻分類模型。
第二方面,本公開的實施例提供了一種用于處理視頻的裝置,該裝置包括:第一獲取單元,被配置成獲取待標注視頻;分類單元,被配置成將待標注視頻輸入預先訓練的視頻分類模型,得到類別信息集合和類別信息對應的概率值,其中,類別信息用于表征待標注視頻所屬的類別;選擇單元,被配置成從類別信息集合中選擇類別信息,其中,所選擇的類別信息對應的概率值大于等于預設的概率閾值;存儲單元,被配置成對于所選擇的類別信息中的類別信息,將待標注視頻存儲到與該類別信息預先建立對應關系的標注隊列中,以使待標注視頻發送到預先與標注隊列建立對應關系的標注終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910084731.1/2.html,轉載請聲明來源鉆瓜專利網。





