[發(fā)明專利]圖像目標(biāo)三維信息標(biāo)注方法在審
| 申請?zhí)枺?/td> | 201910485927.1 | 申請日: | 2019-06-05 |
| 公開(公告)號: | CN110390258A | 公開(公告)日: | 2019-10-29 |
| 發(fā)明(設(shè)計)人: | 李煊鵬;李宇杰;薛啟凡;趙靖文;羅佳奕 | 申請(專利權(quán))人: | 東南大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06T7/60;G06T7/70 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 趙淑芳 |
| 地址: | 211189 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 三維檢測 三維信息 標(biāo)注 三維 模塊讀取 圖像目標(biāo) 相機(jī)標(biāo)定 相機(jī) 圖像 圖像深度信息 相機(jī)坐標(biāo)系 單一圖像 頂點(diǎn)標(biāo)記 二維檢測 目標(biāo)航向 目標(biāo)檢測 內(nèi)參矩陣 所在區(qū)域 投影坐標(biāo) 物理信息 像素坐標(biāo) 檢測框 二維 加載 解算 框邊 算法 航向 繪制 跟蹤 轉(zhuǎn)換 | ||
本發(fā)明公開了一種圖像目標(biāo)三維信息標(biāo)注方法,包括以下步驟:三維信息標(biāo)注模塊讀取圖像,根據(jù)圖像中目標(biāo)所在區(qū)域繪制生成二維矩形檢測框;根據(jù)三維檢測框部分頂點(diǎn)位于二維檢測框邊的關(guān)系,生成原始的三維檢測框;選擇三維檢測框頂點(diǎn)標(biāo)記對原始三維檢測框進(jìn)行調(diào)整,生成可描述目標(biāo)三維尺寸的準(zhǔn)確三維檢測框;三維物理信息解算模塊讀取相機(jī)標(biāo)定數(shù)據(jù)或相機(jī)內(nèi)參矩陣和圖像深度信息數(shù)據(jù),得到目標(biāo)在相機(jī)坐標(biāo)系下的投影坐標(biāo),進(jìn)而得出目標(biāo)的物理尺寸,包括長L、寬W以及航向α。本發(fā)明通過對單一圖像數(shù)據(jù)中的目標(biāo)進(jìn)行三維標(biāo)記獲得尺寸、坐標(biāo)與目標(biāo)航向等具體信息,可加載相應(yīng)的相機(jī)標(biāo)定數(shù)據(jù),實(shí)現(xiàn)像素坐標(biāo)與相機(jī)坐標(biāo)的轉(zhuǎn)換,得到目標(biāo)真實(shí)的三維信息,有利于目標(biāo)檢測、跟蹤等算法的實(shí)現(xiàn)。
技術(shù)領(lǐng)域
本分明涉及圖像信息標(biāo)注,具體涉及一種圖像目標(biāo)三維信息標(biāo)注方法。
背景技術(shù)
隨著人工智能和無人駕駛技術(shù)的日趨發(fā)展,對計算機(jī)視覺算法和深度學(xué)習(xí)的研究成為了學(xué)術(shù)界的熱點(diǎn)課題,而視覺算法,包括目標(biāo)檢測與跟蹤等算法的實(shí)現(xiàn)與發(fā)展必須有龐大的、準(zhǔn)確的道路、街景樣例數(shù)據(jù)的支持。
圖像標(biāo)注工具可以快速、高效地制作算法實(shí)現(xiàn)需要的樣例數(shù)據(jù)集。目前已經(jīng)存在多種二維目標(biāo)標(biāo)記工具,例如labelImg、yolo_mark、Vatic等,這類工具可用于對圖像中目標(biāo)進(jìn)行二維信息標(biāo)注,包含目標(biāo)二維檢測框的像素坐標(biāo)以及目標(biāo)類別,可基本滿足大多數(shù)基于深度學(xué)習(xí)的二維目標(biāo)檢測等算法實(shí)現(xiàn)的數(shù)據(jù)集制作要求。隨著深度學(xué)習(xí)算法研究的不斷深入,以及智能駕駛中對車輛等目標(biāo)三維信息的需求,對三維目標(biāo)檢測與跟蹤等算法的研究也逐漸成為熱點(diǎn)課題,中國專利CN108829435提供了一種圖像標(biāo)注方法及通用圖像標(biāo)記工具,實(shí)現(xiàn)了二維的打點(diǎn)標(biāo)繪、標(biāo)線標(biāo)繪、標(biāo)框標(biāo)繪和區(qū)域標(biāo)繪,但未能解決圖像目標(biāo)的三維信息標(biāo)注。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明的目的是提供一種圖像目標(biāo)三維信息標(biāo)注方法,解決現(xiàn)有標(biāo)注方法不能實(shí)現(xiàn)圖像目標(biāo)的三維信息標(biāo)注的問題。
技術(shù)方案:本發(fā)明所述的圖像目標(biāo)三維信息標(biāo)注方法,包括以下步驟:
(1)三維信息標(biāo)注模塊讀取圖像,根據(jù)圖像中目標(biāo)所在區(qū)域繪制生成二維矩形檢測框;
(2)根據(jù)三維檢測框部分頂點(diǎn)位于二維檢測框邊的關(guān)系,生成原始的三維檢測框;
(3)根據(jù)圖像中目標(biāo)尺寸與航向,選擇三維檢測框頂點(diǎn)標(biāo)記對原始三維檢測框進(jìn)行調(diào)整,使其準(zhǔn)確描述圖像中的目標(biāo)尺寸;
(4)三維物理信息解算模塊讀取相機(jī)標(biāo)定數(shù)據(jù)或相機(jī)內(nèi)參矩陣和圖像深度信息數(shù)據(jù),得到目標(biāo)在相機(jī)坐標(biāo)系下的投影坐標(biāo),進(jìn)而得出目標(biāo)的物理尺寸,包括長L、寬W以及航向α。
其中,所述步驟(1)具體為:根據(jù)圖像輪廓選擇二維檢測框的起始點(diǎn),獲取該起始點(diǎn)的像素坐標(biāo)(x0,y0),該起始點(diǎn)為目標(biāo)二維檢測框的左上頂點(diǎn),生成二維檢測框區(qū)域,并獲取二維檢測框的右下頂點(diǎn)的像素坐標(biāo)(x1,y1)。
所述步驟(2)具體為:根據(jù)目標(biāo)預(yù)設(shè)航向,選擇目標(biāo)二維檢測框的任一頂點(diǎn)作為三維檢測框的起始點(diǎn)(x’0,y’0),二維檢測框中的對頂點(diǎn)作為終止點(diǎn)(x’7,y’7),根據(jù)預(yù)設(shè)的二維檢測框長寬與三維檢測框長寬比,確定三維檢測框其他頂點(diǎn)坐標(biāo),三維檢測框坐標(biāo)為[(x’0,y’0),(x’1,y’1)......(x’7,y’7)]。
所述步驟(4)中,相機(jī)標(biāo)定數(shù)據(jù)包括相機(jī)的安裝角、偏移距離和內(nèi)參矩陣。
所述步驟(4)中讀取相機(jī)標(biāo)定數(shù)據(jù),對三維檢測框的底部四頂點(diǎn)像素坐標(biāo)進(jìn)行反向投影變換,獲得相機(jī)坐標(biāo)系下的投影坐標(biāo)(x1,y1)......(x4,y4),解算得出目標(biāo)的物理尺寸長L、寬W以及航向α:
W=x1-x2
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910485927.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 三維物體檢測裝置以及三維物體檢測方法
- 巷道的內(nèi)部表面形態(tài)的檢測方法、裝置和系統(tǒng)
- 三維面部檢測的方法和裝置
- 一種肺結(jié)節(jié)圖像的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于三維網(wǎng)格及神經(jīng)網(wǎng)絡(luò)的三維物體識別檢測方法
- 三維目標(biāo)檢測方法及三維目標(biāo)檢測器
- 三維目標(biāo)檢測方法及其模型的訓(xùn)練方法及相關(guān)裝置、設(shè)備
- 三維邊緣檢測方法、裝置、存儲介質(zhì)和計算機(jī)設(shè)備
- 人臉檢測方法和裝置
- 一種基于結(jié)構(gòu)光和多光場相機(jī)的三維檢測方法
- 標(biāo)注信息生成裝置、查詢裝置及共享系統(tǒng)
- 一種圖像分割標(biāo)注方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 一種數(shù)據(jù)標(biāo)注方法
- 一種基于群智的語料庫數(shù)據(jù)標(biāo)注方法及系統(tǒng)
- 一種圖像標(biāo)注方法和裝置
- 一種樣本標(biāo)注方法、裝置、存儲介質(zhì)及設(shè)備
- 數(shù)據(jù)標(biāo)注管理方法及裝置、電子設(shè)備和可讀存儲介質(zhì)
- 標(biāo)注的更新方法、裝置、存儲介質(zhì)、處理器以及運(yùn)載工具
- 數(shù)據(jù)的標(biāo)注方法和裝置
- 一種智能標(biāo)注平臺的方法、裝置、電子設(shè)備和存儲介質(zhì)
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對象搜索方法、裝置及系統(tǒng)
- 三維會話數(shù)據(jù)展示方法、裝置、存儲介質(zhì)和計算機(jī)設(shè)備
- 一種三維模型處理方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標(biāo)記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場三維浸入式體驗(yàn)信息傳輸方法及系統(tǒng)
- 用于機(jī)器人生產(chǎn)系統(tǒng)仿真的三維場景管理與文件存儲方法
- 基于三維形狀知識圖譜的三維模型檢索方法及裝置





