[發明專利]一種文字檢測方法及裝置有效
| 申請號: | 201611124294.4 | 申請日: | 2016-12-08 |
| 公開(公告)號: | CN108171104B | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 文亞飛 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V30/414 | 分類號: | G06V30/414;G06V10/26 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 檢測 方法 裝置 | ||
1.一種文字檢測方法,其特征在于,包括:
獲取待檢測圖像的邊緣信息,所述待檢測圖像的邊緣信息包括所述待檢測圖像的邊緣像素點的位置分布信息;
根據所述待檢測圖像的邊緣信息,利用預設的候選文字像素點確定規則確定所述待檢測圖像中的候選文字像素點;所述根據所述待檢測圖像的邊緣信息,利用預設的候選文字像素點確定規則確定所述待檢測圖像中的候選文字像素點,包括:分別以每個邊緣像素點為中心,查詢左右寬度分別為w個像素和上下高度分別為h個像素的圖像區域內存在的其它邊緣像素點的個數;若左右寬度分別為w個像素的圖像區域內存在至少一個其它邊緣像素點,且上下高度分別為h個像素的圖像區域內存在至少一個其它邊緣像素點,則將該邊緣像素點確定為候選文字像素點,w、h均為正整數;
對所述候選文字像素點進行投影切割,根據投影切割結果確定所述待檢測圖像中的文字區域;所述對所述候選文字像素點進行投影切割,根據投影切割結果確定所述待檢測圖像中的文字區域,包括:利用第一切割閾值對所述候選文字像素點進行橫向投影切割,得到初始候選文字區域;利用高低雙閾值對所述初始候選文字區域進行縱向投影切割;利用高低雙閾值對縱向投影切割后的所述初始候選文字區域中的候選文字像素點進行橫向投影切割,以得到目標候選文字區域;利用預設的非文字區域濾除規則濾除所述目標候選文字區域中的非文字區域,將所述目標候選文字區域中的剩余區域作為所述待檢測圖像中的文字區域;
根據所述文字區域的位置信息,對所述文字區域作行歸并處理,所述文字區域的位置信息包括相鄰文字區域邊界的距離;
將行歸并后的所述文字區域輸入預先訓練好的文字檢測模型,以濾除所述文字區域中的非文字區域。
2.根據權利要求1所述的方法,其特征在于,所述獲取待檢測圖像的邊緣信息之前,所述方法還包括:
統計待檢測圖像的灰度直方圖中像素值的分布情況;
根據所述分布情況,確定所述待檢測圖像的圖像類型;
其中,所述獲取待檢測圖像的邊緣信息,包括:
若所述待檢測圖像為簡單圖文,則利用第一邊緣檢測閾值獲取所述待檢測圖像的邊緣信息;
若所述待檢測圖像為復雜圖文,則利用第二邊緣檢測閾值獲取所述待檢測圖像的邊緣信息;
其中,所述第一邊緣檢測閾值小于所述第二邊緣檢測閾值。
3.根據權利要求1所述的方法,其特征在于,所述利用第一切割閾值對所述候選文字像素點進行橫向投影切割,得到初始候選文字區域,包括:
對所述候選文字像素點進行橫向投影切割,將投影點個數大于或等于第一切割閾值的行確定為有效行;
將所述有效行合并得到初始候選文字區域。
4.根據權利要求1所述的方法,其特征在于,所述利用高低雙閾值對縱向投影切割后的所述初始候選文字區域中的候選文字像素點進行橫向投影切割,得到目標候選文字區域之前,所述方法還包括:
利用所述初始候選文字區域中的候選文字像素點的幾何位置約束對所述初始候選文字區域中的候選文字像素點進行縱向投影切割。
5.根據權利要求4所述的方法,其特征在于,
所述幾何位置約束包括:所述初始候選文字區域中兩個連續的候選文字像素點之間的最大距離、所述初始候選文字區域中位置最高的候選文字像素點與位置最低的候選文字像素點之間的最大距離、所述初始候選文字區域中位置最高的候選文字像素點的位置和位置最低的候選文字像素點的位置中的一種或多種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611124294.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:目標檢測方法及裝置
- 下一篇:一種景區游客實名管理系統





