[發明專利]一種文本標注方法在審
| 申請號: | 202110306681.4 | 申請日: | 2021-03-23 |
| 公開(公告)號: | CN113033380A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 張書源 | 申請(專利權)人: | 建信覽智科技(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06F40/143;G06F40/279 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100037 北京市西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 標注 方法 | ||
1.一種文本標注方法,其特征在于,包括如下步驟:
S1:通過對圖像進行人工標注與OCR系統自動識別分別得到實體文字框以及自動檢測文字框;
S2:計算實體文字框與自動檢測文字框的重疊度,根據重疊度鏈接兩個文字框,得到自動檢測文字框的文本;
S3:根據實體文字框從圖像中將實體文字影像切出,得到文字條影像;
S4:將得到的文字條影像送入OCR系統進行識別;
S5:將步驟S4中識別出來的文本與步驟S2中自動檢測文字框中識別到的文本進行匹配,生成文本標注數據。
2.根據權利要求1所述的文本標注方法,其特征在于,步驟S1中,還包括得到實體文字框的坐標信息,以及通過pixelink算法得到自動檢測文字框的坐標信息。
3.根據權利要求2所述的文本標注方法,其特征在于,步驟S1及步驟S2之間還包括對自動檢測文字框的坐標信息進行還原,以使OCR系統自動識別后的文字框坐標還原為原始圖像的坐標。
4.根據權利要求3所述的文本標注方法,其特征在于,以圖像的左上角為坐標原點,坐標還原包括:
當圖像縮放m倍后:
x=1/m*x0
y=1/m*y0;
當圖像平移(a,b)距離后:
x=x0-a
y=y0-b;
當圖像逆時針旋轉θ后:
x=(x0*sinθ-y0*cosθ)/(sin2θ-cos2θ)
y=(y0*sinθ-x0*cosθ)/(sin2θ-cos2θ);
其中:x0,y0為自動檢測文字框的坐標,x,y為還原為原始圖像的坐標。
5.根據權利要求2所述的文本標注方法,其特征在于,步驟S2中,通過實體文字框的坐標信息與自動檢測文字框經過還原后的坐標信息計算重疊度。
6.根據權利要求5所述的文本標注方法,其特征在于,步驟S2中,計算實體文字框與自動檢測文字框的重疊度包括:
其中:IOU為重疊度,I(X)為兩個文字框的交集,U(X)為兩個文字框的并集。
7.根據權利要求6所述的文本標注方法,其特征在于,步驟S2中,如果實體文字框與自動檢測文字框的重疊度大于0.7,對實體文字框與自動檢測文字框進行鏈接。
8.根據權利要求1所述的文本標注方法,其特征在于,步驟S5中,通過正則表達式,以及最長公共子序列算法對文本進行匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于建信覽智科技(北京)有限公司,未經建信覽智科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110306681.4/1.html,轉載請聲明來源鉆瓜專利網。





