[發(fā)明專利]圖像標注方法及裝置、特征圖生成方法及裝置在審
| 申請?zhí)枺?/td> | 201811584634.0 | 申請日: | 2018-12-24 |
| 公開(公告)號: | CN109658481A | 公開(公告)日: | 2019-04-19 |
| 發(fā)明(設計)人: | 李健昆;范浩強 | 申請(專利權)人: | 北京曠視科技有限公司 |
| 主分類號: | G06T11/60 | 分類號: | G06T11/60;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡志成知識產(chǎn)權代理事務所(普通合伙) 11371 | 代理人: | 蘇勝 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標注 像素 圖像標注 結(jié)果圖像 相似性度量 特征圖 集合 相似性度量計算 實時顯示 像素集合 形狀支持 原始圖像 自適應性 預覽 檢測 | ||
本發(fā)明涉及圖像標注技術領域,提供一種圖像標注方法及裝置、特征圖生成方法及裝置。其中,圖像標注方法包括:當檢測到畫刷的第一操作時,確定第一操作對應的原始圖像中的第一像素;獲取畫刷范圍內(nèi)的每個第二像素與第一像素的相似性度量;根據(jù)相似性度量確定與第一像素相似的第二像素的集合,在標注結(jié)果圖像上顯示第二像素的集合的位置。在上述方法中,在標注結(jié)果圖像上顯示的第二像素集合的位置可以視為畫刷當前的形狀,畫刷的形狀是根據(jù)相似性度量計算的,因此具有自適應性,有利于改善標注質(zhì)量,提高標注效率。同時,該畫刷的形狀支持在標注結(jié)果圖像上實時顯示,使得標注員能夠根據(jù)預覽到的內(nèi)容作出更為精確的標注行為,從而提高標注質(zhì)量。
技術領域
本發(fā)明涉及圖像標注技術領域,具體而言,涉及一種圖像標注方法及裝置、特征圖生成方法及裝置。
背景技術
圖像語義分割和實例分割是計算機視覺領域的核心任務之一,其在自動駕駛、人像美化以及醫(yī)療圖像分析等領域中都發(fā)揮著重要作用。隨著深度學習的興起,利用卷積神經(jīng)網(wǎng)絡進行語義和實例分割憑借其優(yōu)異的性能成為了當前處理圖像分割任務的主流方法。為訓練圖像分割用的網(wǎng)絡模型,需要對原始圖像進行逐像素的標注,即為每個像素指定一個表示其類別的標簽。
現(xiàn)有的標注工具為標注員提供畫刷,標注員通過肉眼觀察的方式判斷像素區(qū)域的類別,然后用畫刷在像素區(qū)域中進行涂抹,將屬于同一類別像素區(qū)域涂成同一種顏色,不同的顏色即可以作為標識不同類別的像素區(qū)域的標簽。
然而,現(xiàn)有的畫刷形狀是固定的,當原始圖像中不同類別的像素區(qū)域之間具有復雜的邊界時,采用固定形狀的畫刷進行涂抹可能導致標注錯誤,如果反復切換畫刷的尺寸又會導致標注效率低下。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供一種圖像標注方法及裝置、特征圖生成方法及裝置,采用具有自適應形狀的畫刷進行標注,提高標注的精度和效率。
為實現(xiàn)上述目的,本發(fā)明提供如下技術方案:
第一方面,本發(fā)明實施例提供一種圖像標注方法,包括:
當檢測到標注用的畫刷的第一操作時,確定第一操作對應的原始圖像中的第一像素;
獲取畫刷范圍內(nèi)的每個第二像素與第一像素的相似性度量,其中,畫刷范圍是指畫刷在原始圖像上覆蓋的包括第一像素的區(qū)域;
根據(jù)相似性度量確定與第一像素相似的第二像素的集合,在標注結(jié)果圖像上顯示第二像素的集合的位置。
在上述方法中,在標注結(jié)果圖像上顯示的第二像素集合的位置可以視為畫刷當前的形狀,該形狀是根據(jù)第一像素與第二像素的相似性度量計算的,相當于根據(jù)相似性度量對標注結(jié)果作了自動推薦,因此其形狀具有自適應性,例如在原始圖像中不同類別的像素區(qū)域之間的邊界處進行標注時,該畫刷能夠自適應邊界的形狀,從而有利于改善標注結(jié)果的質(zhì)量,提高標注員的標注效率。另一方面,該畫刷的形狀支持在標注結(jié)果圖像上實時顯示,相當于可以對標注結(jié)果進行預覽,從而使得標注員能夠根據(jù)預覽到的內(nèi)容作出更為精確的標注行為,從而提高標注質(zhì)量。
在一些實施例中,相似性度量根據(jù)第一像素與第二像素在特征空間中的距離進行計算,特征空間為第一特征圖中的像素對應的向量所在的向量空間,第一特征圖是利用卷積神經(jīng)網(wǎng)絡對原始圖像進行特征提取后獲得的。
一方面,原始圖像中的像素之間可能存在噪聲干擾,將原始圖像中的像素映射到特征空間以后,可以減小噪聲的影響。另一方面,原始圖像中的像素之間語義關聯(lián)性不清晰,而特征圖由于經(jīng)過了卷積神經(jīng)網(wǎng)絡的處理,其中的每個像素具有一定的感受野,從而相互之間具有更清晰的語義關聯(lián)性。綜合以上兩方面,利用特征圖上的像素(原始圖像上的像素映射到特征空間就是映射為特征圖上的像素)之間的距離來計算相似性度量,能夠更準確地表征第一像素與第二像素的相似程度。
在一些實施例中,相似性度量根據(jù)第一像素與第二像素在原始圖像上的距離,以及第一像素與第二像素在特征空間中的距離進行計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司,未經(jīng)北京曠視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811584634.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





