[發明專利]文本檢測方法、裝置、電子設備及計算機存儲介質有效
| 申請號: | 202010881268.6 | 申請日: | 2020-08-27 |
| 公開(公告)號: | CN112101347B | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 秦勇;李兵 | 申請(專利權)人: | 北京易真學思教育科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46;G06K9/34 |
| 代理公司: | 北京合智同創知識產權代理有限公司 11545 | 代理人: | 李杰;蘭淑鐸 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢測 方法 裝置 電子設備 計算機 存儲 介質 | ||
1.一種文本檢測方法,其特征在于,所述方法包括:
對待檢測文本圖像進行特征提取,得到所述待檢測文本圖像對應的真實文本概率圖和至少一個像素點類別概率圖,其中,所述像素點類別概率圖用于指示所述待檢測文本圖像中的像素點屬于各個不同區域類型的概率,所述區域類型包括以下至少之一:非重疊文本區域和重疊文本區域;
對所述真實文本概率圖進行二值化,得到真實文本二值圖;
根據所述真實文本二值圖和所述至少一個像素點類別概率圖,生成至少一個像素點類別二值圖;
從所述至少一個像素點類別二值圖中確定基準像素點類別二值圖,并計算所述基準像素點類別二值圖對應的多個基準連通域;
根據所述多個基準連通域和所述至少一個像素點類別二值圖中除去所述基準像素點類別二值圖外的二值圖,獲得所述待檢測文本圖像的文本檢測結果。
2.根據權利要求1所述的方法,其特征在于,所述重疊文本區域包括以下至少之一:多個文本區域中兩兩重疊的區域、多個文本區域均重疊的區域。
3.根據權利要求1所述的方法,其特征在于,根據所述真實文本二值圖和所述至少一個像素點類別概率圖,生成至少一個像素點類別二值圖,包括:
根據所述至少一個像素點類別概率圖,確定所述待檢測文本圖像中每個像素點的像素點類別;
根據所述每個像素點的像素點類別和所述真實文本二值圖,生成不同像素點類別對應的像素點類別二值圖。
4.根據權利要求3所述的方法,其特征在于,根據所述至少一個像素點類別概率圖,確定所述待檢測文本圖像中每個像素點的像素點類別,包括:
將所述每個像素點在至少一個像素點類別概率圖中概率最大的像素點類別,確定為所述每個像素點的像素點類別。
5.根據權利要求1所述的方法,其特征在于,根據所述多個基準連通域和所述至少一個像素點類別二值圖中除去所述基準像素點類別二值圖外的二值圖,獲得所述待檢測文本圖像的文本檢測結果,包括:
分別對所述至少一個像素點類別二值圖中除去所述基準像素點類別二值圖外的二值圖求取連通域,得到至少一個待選連通域;
針對每個所述基準連通域,根據所述基準連通域的像素點坐標和所述至少一個待選連通域的像素點坐標,確定真實文本區域坐標;
根據所述真實文本區域坐標,獲得所述待檢測文本圖像的文本檢測結果。
6.根據權利要求5所述的方法,其特征在于,根據基準連通域的像素點坐標和所述至少一個待選連通域的像素點坐標,確定真實文本區域坐標,包括:
根據所述基準連通域的像素點坐標確定所述基準連通域對應的初始像素坐標點集合;
將所述至少一個待選連通域中的每個待選連通域的像素點坐標依次加入所述初始像素坐標點集合中;
根據加入像素點坐標后的所述初始像素坐標點集合中的像素坐標點的數量,確定所述真實文本區域坐標。
7.根據權利要求6所述的方法,其特征在于,根據加入像素點坐標后的所述初始像素坐標點集合中的像素坐標點的數量,確定所述真實文本區域坐標,包括:
在每加入一個待選連通域的像素點坐標后,根據加入像素點坐標后的所述初始像素坐標點集合中的像素坐標點的數量,判斷加入的待選連通域是否為所述基準連通域的關聯連通域;
若為關聯連通域,則將加入像素點坐標后的所述初始像素坐標點集合作為新集合,并根據所述新集合和剩余的待選連通域,確定真實文本區域坐標;
或者,若不為關聯連通域,則根據所述初始像素坐標點集合和剩余的待選連通域,確定真實文本區域坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京易真學思教育科技有限公司,未經北京易真學思教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010881268.6/1.html,轉載請聲明來源鉆瓜專利網。





