[發明專利]一種區域標注方法、裝置、設備及存儲介質在審
| 申請號: | 202010712116.3 | 申請日: | 2020-07-22 |
| 公開(公告)號: | CN111860484A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 王洪振;黃珊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王兆林 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 區域 標注 方法 裝置 設備 存儲 介質 | ||
本申請實施例公開了人工智能領域的區域標注方法、裝置、設備及存儲介質,其中該方法包括:獲取針對目標曲形文本的覆蓋區域邊界標記的N個標注點;在N個標注點中確定待標注的目標曲形區域的四個角點;根據四個角點,從N個標注點中選出用于擬合第一曲線的標注點組成第一標注點集合,從N個標注點中選出用于擬合第二曲線的標注點組成第二標注點集合,第一曲線和第二曲線為目標曲形區域相對的兩條曲線邊界;根據第一標注點集合中的標注點擬合第一曲線,根據第二標注點集合中的標注點擬合第二曲線;基于第一曲線和第二曲線構建目標曲形區域。該方法能兼顧提高曲形文本標注區域的標注質量和降低標注時間成本。
技術領域
本申請涉及人工智能(Artificial Intelligence,AI)技術領域,尤其涉及一種區域標注方法、裝置、設備及存儲介質。
背景技術
光學字符識別(Optical Character Recognition,OCR)是計算機視覺領域中一個重要的熱點研究問題,曲形文本識別作為OCR技術的重要應用之一,用于識別呈曲形分布的文本字符。近年來,隨著深度學習技術在圖像處理領域的迅速發展,基于深度學習的OCR已成為主流趨勢。深度學習通常需要大量的標注數據對處理模型進行訓練,對于用于實現曲形文本識別的模型,往往需要使用大量標注有曲形文本區域的樣本對其進行訓練。
目前主流的曲形文本區域的標注方法是基于開源工具LabelMe實現的,將待標注樣本輸入LabelMe后,標注人員可以在分布有文本的曲形區域的邊界手動點擊標記若干標注點,進而,LabelMe可以利用直線將所標記的標注點連接起來組成多邊形,作為曲形文本區域的標注結果。
經上述方法得到的標注結果的標注質量與標注人員標記的標注點數量有很大關系。如圖1所示,標注人員標記的標注點越多、標注點分布越密集,LabelMe生成的多邊形(即曲形文本區域的標注結果)越接近理想標注結果,但是需要耗費的標注時間成本較高;反之,標注人員標記的標注點越少、標注點分布越稀疏,所需耗費的標注時間成本越低,但是LabelMe生成的多邊形與理想標注結果之間的偏差較大,不利于后續的模型訓練。
綜上,如何在耗費較低標注時間成本的條件下,保證曲形文本區域的標注質量,已成為目前亟待解決的問題。
發明內容
本申請實施例提供了一種區域標注方法、裝置、設備及存儲介質,能夠兼顧提高曲形文本標注區域的標注質量和降低標注時間成本。
有鑒于此,本申請第一方面提供了一種區域標注方法,所述方法包括:
獲取針對目標曲形文本的覆蓋區域邊界標記的N個標注點;所述N為大于4的整數;
在所述N個標注點中確定待標注的目標曲形區域的四個角點;
根據所述四個角點,從所述N個標注點中選出用于擬合第一曲線的標注點組成第一標注點集合,從所述N個標注點中選出用于擬合第二曲線的標注點組成第二標注點集合;所述第一曲線和所述第二曲線為所述目標曲形區域相對的兩條曲線邊界;
根據所述第一標注點集合中的標注點擬合所述第一曲線,根據所述第二標注點集合中的標注點擬合所述第二曲線;
基于所述第一曲線和所述第二曲線,構建所述目標曲形區域。
本申請第二方面提供了一種區域標注裝置,所述裝置包括:
標注點獲取模塊,用于獲取針對目標曲形文本的覆蓋區域邊界標記的N個標注點;所述N為大于4的整數;
角點確定模塊,用于在所述N個標注點中確定待標注的目標曲形區域的四個角點;
標注點集合確定模塊,用于根據所述四個角點,從所述N個標注點中選出用于擬合第一曲線的標注點組成第一標注點集合,從所述N個標注點中選出用于擬合第二曲線的標注點組成第二標注點集合;所述第一曲線和所述第二曲線為所述目標曲形區域相對的兩條曲線邊界;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010712116.3/2.html,轉載請聲明來源鉆瓜專利網。





