[發明專利]一種視頻及圖像中目標任意角度標記方法在審
| 申請號: | 201710554693.2 | 申請日: | 2017-07-10 |
| 公開(公告)號: | CN107273937A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 任柯燕;李思洋;侯義斌;李潤奇 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/36 |
| 代理公司: | 北京思海天達知識產權代理有限公司11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 圖像 目標 任意 角度 標記 方法 | ||
技術領域
本發明屬于計算機圖像中目標檢測識別領域,尤其涉及一種視頻及圖像中目標任意角度標記方法,用于提高算法的識別率。
背景技術
在視頻目標跟蹤及圖像目標檢測識別領域中,用于訓練的正樣本的標注準確性,對訓練模型的精度起著重要作用。高精度的訓練模型能夠讓算法更準確地檢測和識別圖像中的目標位置、形狀、類別等特征。用于訓練的正樣本,通常根據所要完成的任務設計樣本標注方式。
傳統的目標檢測和識別算法是用平行或垂直于圖像XY軸的矩形框標記圖像中的目標,對于在地面拍攝的視頻或圖像,目標往往平行或垂直于地面,用平行或垂直于圖像XY軸的矩形框標記可以較為接近物體輪廓。然而,當目標在空中運動或在空中動態采集的視頻或圖像,其中的目標在圖像中往往是任意角度的,傳統的平行或垂直于圖像XY軸的角度固定的矩形標注框必然包含較多實際上并不是目標而是目標周圍背景的部分,這樣的標注樣本用于訓練會降低算法效率甚至影響檢測和識別的速度和準確率。因此本發明旨在根據目標在圖像中的位置,設計任意角度目標標記工具,使得圖像標記能盡可能貼近目標的真實形狀,減少標記區域的無關背景面積,提高訓練的效率和準確率,進而提高檢測和識別的速度和準確率。
發明內容
本發明目的在于提供一種用于圖像檢測和識別中用于訓練目標內容的標記方法。
本發明的特征在于標記方法與傳統的方法的不同,有三種標記算法及每個目標身份編號方式:
1、任取3個及以上點,求包圍正樣本目標的任意角度(但不垂直于xy軸)最小外接矩形;
2、任取3個及以上點,求平行于XY軸的最小外接矩,而傳統方法是通過拖拽形成的矩形框;
3、取任意點數,貼近于目標形狀,連接每個點形成貼近目標形狀的封閉編輯框;
4、對于用于視頻目標跟蹤的每一個目標,可以手工對目標編號,以便驗證算法的跟蹤性能。
本發明意在創新圖像標記方式,使得圖像標記能盡可能貼近目標的真實形狀,減少標記區域的無關背景面積,提高訓練的效率和準確率,進而提高檢測和識別的速度和準確率。具體方式是根據一個多邊形的外接矩形至少存在一條邊與原多邊形重合定理,利用數學函數通過建立凸外形并且旋轉外形以尋找給定點集的最小面積的包圍矩形最小外接矩形。至少標記三個目標的邊緣點,算法就能求出最小包圍面積的外接矩形,所以可以根據實際情況,將目標最突出的點標記后,算法函數會自動求出最小包圍面積的外接矩形。這樣的方法與傳統方法相比更加靈活和高效,矩形角度不再固定,標記的矩形框更好的貼近真實的目標形狀,盡可能減少了無關部分的面積。
為實現上述目的,本發明采用如下的技術方案:
一種視頻及圖像中目標任意角度標記方法,包括以下步驟:
步驟(1)、加載一張或多張圖片;
步驟(2)、選擇一張圖片,在圖像中標記目標突出點,更具實際情況至少標記三個點;
步驟(3)、根據輸入點集,利用函數尋找點集的最小包圍面積的外接矩形,或者根據實際需要直接標記出多邊形;最小外接矩形函數計算并返回指定點集的最小區域邊界矩形,輸出是矩形的四個點坐標;
步驟(4)、可選擇給標記框加上ID,可以用于訓練跟蹤算法在不同幀識別同一個的目標;
步驟(5)、人工確認目標被正確標記后可選擇是否刪除標記框,添加或刪除其中的標記點重新執行步驟(3)(4),生成標記框供用戶確認;
步驟(6)、用戶確認后決定是否在這張圖片上繼續標記其他目標;
步驟(7)、標記完所有目標后手動結束標記,軟件自動生成用于訓練的txt和xml文件;
步驟(8)、用戶決定是否標記剩余圖片,或者重新執行步驟(1)。
作為優選,步驟(3)中利用最小外接矩形函數,輸入標記點,根據點集求出標記目標的最小外接矩形具體如下:
在初始xy坐標系中建立點集P={(x1,y1),(x2,y2),…,(xn,yn)|n≥3},同時生成標志集合B={b1,b2,…,bn},生成端點集合E={p1,p2,p3,p4,d}以及已旋轉角度D,且初始值為0,s點集個數大于等于3且沒有上限,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710554693.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





