[發明專利]一種基于多分類的文本檢測方法及系統在審
| 申請號: | 202211321333.5 | 申請日: | 2022-10-26 |
| 公開(公告)號: | CN115620327A | 公開(公告)日: | 2023-01-17 |
| 發明(設計)人: | 吳婷婷;陳德意;黃裕錕;高志鵬;趙建強;金輝;韓名羲 | 申請(專利權)人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413;G06V30/19;G06V10/82 |
| 代理公司: | 廈門福貝知識產權代理事務所(普通合伙) 35235 | 代理人: | 郭涵煒 |
| 地址: | 361000 福建省廈門市思明*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分類 文本 檢測 方法 系統 | ||
1.一種基于多分類的文本檢測方法,其特征在于,包括以下步驟:
S1、獲取并整理文本框樣本,將所述文本框樣本切分成文本單元,并對所述文本單元的坐標和標志位進行標注;
S2、將所述文本框樣本按比例生成訓練集和驗證集,并且對所述文本單元的標志位賦類標;
S3、構建文本單元檢測網絡模型,通過所述文本單元檢測網絡模型對所述訓練集進行訓練至損失收斂,獲取完成訓練的模型輸出,所述輸出為集合B;
S4、構建文本單元合并算法,根據標志位的類標劃分所述集合B,形成多個子集,根據當前元素和所述當前元素所屬子集內的元素計算獲取點集cnt外接矩形,所述外接矩形為合并完成的文本框;以及
S5、將所述驗證集輸入步驟S3中完成訓練的模型中,最終獲得所述驗證集上所有的文本框。
2.根據權利要求1所述的基于多分類的文本檢測方法,其特征在于,在步驟S1中,獲取并整理文本框樣本,包括以下子步驟:
S11、獲取文本檢測數據集,以柵格化方法對所述文本檢測數據集的文本框進行切分,形成文本單元;
S12、對每個所述文本單元進行標注,計算切分后的文本單元坐標,標注格式為(x,y,w,h),其中(x,y,)為所述文本單元的中心點坐標,(w,h)為所述文本單元的寬高;
S13、對所述文本框的第一個文本單元、最后一個文本單元的標志位進行標記、以及每兩個文本單元之間的標志位進行標記。
3.根據權利要求2所述的基于多分類的文本檢測方法,其特征在于,在步驟S13中,對每兩個文本單元之間的標志位進行標記,包括以下子步驟,其中,(xpre,ypre)為當前文本單元的的中心坐標點,(xnext,ynext)為下一個文本單元的中心坐標點:
S131、計算所述當前文本單元與所述下一個文本單元中心點距離,若ynext-ypre=0,則當前文本框結束標志位與下一文本框起始標志位標為horizontal;
S132、若xnext-xpre=0,則所述當前文本框結束標志位與所述下一文本框起始標志位標為vertical;
S133、若ynext-ypre0,則所述當前文本框結束標志位與所述下一文本框起始標志位標為up;
S134、若ynext-ypre0,則所述當前文本框結束標志位與所述下一文本框起始標志位標為down。
4.根據權利要求1所述的基于多分類的文本檢測方法,其特征在于,在步驟S4中,構建文本單元合并算法,根據標志位的類標劃分所述集合B,包括根據起始標志位start的不同類標,將所述集合B中的元素分為多個子集:Bfirst(start=0),Bstart_2(start=2),Bstart_3(start=3),Bstart_4(start=4)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市美亞柏科信息股份有限公司,未經廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211321333.5/1.html,轉載請聲明來源鉆瓜專利網。





