[發明專利]視頻中的對象標注方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202011254673.1 | 申請日: | 2020-11-11 |
| 公開(公告)號: | CN112070071B | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 馬聰 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 徐立 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 中的 對象 標注 方法 裝置 計算機 設備 存儲 介質 | ||
本申請是關于一種視頻中的對象標注方法、裝置、計算機設備及存儲介質,涉及圖像處理技術領域。所述方法包括:獲取視頻的各個圖像幀中的子圖像區域;基于所述各個圖像幀中的子圖像區域的相似度,對所述各個圖像幀中的子圖像區域進行關聯,獲得至少兩個軌跡片段;對所述至少兩個軌跡片段進行合并,獲得至少一個區域軌跡;在所述各個圖像幀中,將所述區域軌跡中的各個子圖像區域標注為同一個指定類型對象所在的區域。通過上述方案,在針對自動駕駛等人工智能場景構建訓練數據集時,不需要人工對圖像幀中的指定類型對象進行標注,能夠極大的提高在視頻中進行對象標注的效率。
技術領域
本申請涉及圖像處理技術領域,特別涉及一種視頻中的對象標注方法、裝置、計算機設備及存儲介質。
背景技術
在涉及圖像識別的人工智能(Artificial Intelligence,AI)場景中,通常需要大量的圖像訓練數據進行機器學習。其中,從視頻的圖像幀中標注出需要的對象,是獲取此類圖像訓練數據的重要渠道。
在相關技術中,從視頻的圖像幀中標注出需要的對象(比如人或物體)時,通常需要開發人員進行人工標注。例如,對于一個視頻,開發人員在該視頻的各個圖像幀中手動框選需要的對象所在的位置,并為各個圖像幀中同一個對象設置相同的編號,以完成對視頻中的對象的標注。
然而,上述人工標注的方案需要用戶對視頻逐幀進行對象框選,需要耗費較長的時間,導致對視頻中的對象的標注效率較低。
發明內容
本申請實施例提供了一種視頻中的對象標注方法、裝置、計算機設備及存儲介質,可以提高在視頻中標注同一對象的效率,該技術方案包括以下內容。
一方面,提供了一種視頻中的對象標注方法,所述方法包括:
獲取視頻的各個圖像幀中的子圖像區域;所述子圖像區域是指定類型對象的圖像在對應的圖像幀中的區域;
基于所述各個圖像幀中的子圖像區域的相似度,對所述各個圖像幀中的子圖像區域進行關聯,獲得至少兩個軌跡片段;所述軌跡片段由連續的圖像幀中的各一個子圖像區域構成;
對所述至少兩個軌跡片段進行合并,獲得至少一個區域軌跡;
在所述各個圖像幀中,將所述區域軌跡中的各個子圖像區域標注為同一個指定類型對象所在的區域。
一方面,提供了一種視頻中的對象標注裝置,所述裝置包括:
區域獲取模塊,用于獲取視頻的各個圖像幀中的子圖像區域;所述子圖像區域是指定類型對象的圖像在對應的圖像幀中的區域;
區域關聯模塊,用于基于所述各個圖像幀中的子圖像區域的相似度,對所述各個圖像幀中的子圖像區域進行關聯,獲得至少兩個軌跡片段;所述軌跡片段由連續的圖像幀中的各一個子圖像區域構成;
合并模塊,用于對所述至少兩個軌跡片段進行合并,獲得至少一個區域軌跡;
對象標注模塊,用于在所述各個圖像幀中,將所述區域軌跡中的各個子圖像區域標注為同一個指定類型對象所在的區域。
在一種可能的實現方式中,所述區域關聯模塊,包括:
區域確定單元,用于基于第一圖像幀內的第一區域,與第二圖像幀中的各個子圖像區域之間的區域相似度,從所述第二圖像幀中的各個子圖像區域中確定滿足匹配條件的第二區域;所述第一圖像幀和所述第二圖像幀是所述各個圖像幀中的相鄰兩個圖像幀;所述第一區域是目標軌跡片段對應在所述第一圖像幀中的區域;
區域添加單元,用于將所述第二區域添加為所述目標軌跡片段在所述第二圖像幀中的區域。
在一種可能的實現方式中,所述區域確定單元,用于,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011254673.1/2.html,轉載請聲明來源鉆瓜專利網。





