[發明專利]針對多視頻幀的標注方法、裝置、設備和存儲介質有效
| 申請號: | 202110362493.3 | 申請日: | 2021-04-02 |
| 公開(公告)號: | CN113096003B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 石佳;侯文博;李翔;李俊橋 | 申請(專利權)人: | 北京車和家信息技術有限公司 |
| 主分類號: | G06T3/00 | 分類號: | G06T3/00;G06T7/70;G06T7/80;G06T19/20 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 任媛;劉鐵生 |
| 地址: | 101300 北京市順義區高麗營*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 視頻 標注 方法 裝置 設備 存儲 介質 | ||
本申請提供一種針對多視頻幀的標注方法、裝置、設備和存儲介質,涉及圖像處理技術領域。其中,一種針對多視頻幀的標注方法,包括:獲取針對相同區域采集的多個視頻幀;根據所述多個視頻幀進行三維重建,得到所述區域對應的三維重建場景;基于所述三維重建場景進行標注,得到所述三維重建場景中的標注信息;將所述三維重建場景中的標注信息投影至多個所述視頻幀中,得到多個所述視頻幀中的標注信息。上述方法能夠實現視頻幀的批量化標注,可以有效提高多視頻幀的標注效率,以及降低標注工作的人力成本。
技術領域
本申請涉及圖像處理技術領域,尤其涉及一種針對多視頻幀的標注方法、裝置、設備和存儲介質。
背景技術
在無人駕駛技術領域中,圖像感知算法作為核心算法得到廣泛應用,其能夠基于無人駕駛設備采集的連續圖像幀,采用機器學習的方式進行定位和障礙物的識別等。在機器學習的訓練過程中,需要對訓練樣本數據所對應的圖像幀中的目標物體進行標注。
目前,大多數用于圖像感知算法中的標注都來源于人工標注,并且標注人員只在單幀圖像上進行標注。這樣的標注方式會耗費大量的人力物力,并且自動駕駛領域需要進行連續幀的標注,這樣又大幅增加了標注工作量和標注成本。
鑒于上述問題,需要提供一種能夠提高多視頻幀的標注效率的方案。
發明內容
本申請實施例的目的是提供一種針對多視頻幀的標注方法、裝置、設備和存儲介質,以至少解決如何提高多視頻幀的標注效率的問題。
為解決上述技術問題,本申請實施例提供如下技術方案:
本申請第一方面提供一種針對多視頻幀的標注方法,所述方法包括:
獲取針對相同區域采集的多個視頻幀;
根據所述多個視頻幀進行三維重建,得到所述區域對應的三維重建場景;
基于所述三維重建場景進行標注,得到所述三維重建場景中的標注信息;
將所述三維重建場景中的標注信息投影至多個所述視頻幀中,得到多個所述視頻幀中的標注信息。
本申請第二方面提供一種針對多視頻幀的標注裝置,所述裝置包括:
視頻幀獲取模塊,用于獲取針對相同區域采集的多個視頻幀;
三維重建模塊,用于根據所述多個視頻幀進行三維重建,得到所述區域對應的三維重建場景;
三維標注模塊,用于基于所述三維重建場景進行標注,得到所述三維重建場景中的標注信息;
標注投影模塊,用于將所述三維重建場景中的標注信息投影至多個所述視頻幀中,得到多個所述視頻幀中的標注信息。
本申請第三方面提供一種電子設備,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器運行所述計算機程序時執行以實現本申請第一方面所述的方法。
本申請第四方面提供一種計算機可讀存儲介質,其上存儲有計算機可讀指令,所述計算機可讀指令可被處理器執行以實現本申請第一方面所述的方法。
本申請第一方面提供的一種針對多視頻幀的標注方法,通過獲取針對相同區域采集的多個視頻幀,根據所述多個視頻幀進行三維重建,得到所述區域對應的三維重建場景,然后基于所述三維重建場景進行標注,得到所述三維重建場景中的標注信息,再將所述三維重建場景中的標注信息投影至多個所述視頻幀中,得到多個所述視頻幀中的標注信息,相較于現有技術中需對每張視頻幀分別人工標注的方式,用戶只需要在三維重建場景中進行標注,即可自動將標注信息反向投影到多個視頻幀中,實現視頻幀的批量化標注,可以有效提高多視頻幀的標注效率,以及降低標注工作的人力成本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京車和家信息技術有限公司,未經北京車和家信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110362493.3/2.html,轉載請聲明來源鉆瓜專利網。





