[發明專利]字符遮擋檢測方法及裝置有效
| 申請號: | 201810866733.1 | 申請日: | 2018-08-01 |
| 公開(公告)號: | CN109117843B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 劉盼盼;尹飛;項金鑫;柏馨;張婷;薛大偉;邢潘紅;魏晨輝 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V30/18;G06V30/186 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 遮擋 檢測 方法 裝置 | ||
1.一種字符遮擋檢測方法,其特征在于,包括:
獲取待處理的圖像;所述圖像中包括:至少一個文本區域;所述文本區域為文本內容對應的區域;
針對每個文本區域,獲取所述文本區域中各個字符的長寬比以及平均厚度;
獲取所述文本區域中位于區域邊緣的字符對應的數組;所述數組中包括:所述字符中與背景色相鄰的一排像素點的顏色信息、位置信息、是否橫向筆畫、是否豎向筆畫、厚度信息,所述字符的厚度信息包括所述字符中筆畫的粗細;
判斷所述數組中是否存在第一數組;所述第一數組中具有文字主體色的像素點的比例大于預設比例值;
若存在所述第一數組,則判斷所述數組中是否存在第二數組;所述第二數組中的厚度信息與所述平均厚度的差值大于第一預設數值,或者,所述第二數組對應的字符的長寬比屬于第一預設長寬比范圍;
若存在所述第二數組,則確定所述文本區域中存在被遮擋字符。
2.根據權利要求1所述的方法,其特征在于,還包括:
若不存在所述第一數組,則確定所述文本區域中不存在被遮擋字符。
3.根據權利要求1所述的方法,其特征在于,還包括:
若存在所述第一數組,且所述文本區域中的所有數組滿足第一預設條件,則判斷所述文本區域中的字符是否為黑體;所述第一預設條件為,數組中的厚度信息與所述平均厚度的差值小于等于第一預設數值且大于第二預設數值,且數組對應的字符的長寬比屬于第二預設長寬比范圍;
若所述文本區域中的字符為黑體,則確定所述文本區域中不存在被遮擋字符;
若所述文本區域中的字符為非黑體,則確定所述文本區域中存在被遮擋字符。
4.根據權利要求1所述的方法,其特征在于,還包括:
若存在所述第一數組,且所述文本區域中的所有數組滿足第二預設條件,則確定所述文本區域中不存在被遮擋字符;所述第二預設條件為,數組中的厚度信息與所述平均厚度的差值小于等于第二預設數值,且數組對應的字符的長寬比屬于第三預設長寬比范圍。
5.根據權利要求1所述的方法,其特征在于,還包括:
若存在所述第一數組,則判斷所述文本區域是否為封閉區域;
若所述文本區域為封閉區域,則確定所述文本區域中不存在被遮擋字符;
若所述文本區域為非封閉區域,則判斷所述數組中是否存在第二數組。
6.根據權利要求1所述的方法,其特征在于,所述針對每個文本區域,獲取所述文本區域中各個字符的長寬比以及平均厚度之前,還包括:
對所述圖像進行控件區域識別,獲取所述圖像中的至少一個控件區域;
判斷所述控件區域是否為文本區域;
若所述控件區域為非文本區域,則刪除所述控件區域。
7.根據權利要求1所述的方法,其特征在于,所述針對每個文本區域,獲取所述文本區域中各個字符的長寬比以及平均厚度,包括:
針對每個文本區域,根據所述文本區域中字符的灰度確定灰度直方圖;
根據所述灰度直方圖,確定所述文本區域中的背景色和文字主體色;
豎向掃描所述文本區域中連續非背景色的像素,獲取所述文本區域中各個字符的厚度信息以及長寬比;
根據所述文本區域中各個字符的厚度信息,確定所述平均厚度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810866733.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像檢查中的二值化處理程序和二值化處理方法
- 下一篇:一種密碼確定方法和裝置





