[發明專利]文字識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110265269.2 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN112906686A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 王棟 | 申請(專利權)人: | 北京小米移動軟件有限公司;北京小米松果電子有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34 |
| 代理公司: | 北京善任知識產權代理有限公司 11650 | 代理人: | 張振偉 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 識別 方法 裝置 電子設備 存儲 介質 | ||
本公開是關于一種文字識別的處理方法、裝置、電子設備及存儲介質,所述方法包括:對獲取的原始圖像進行圖像處理,得到包含文字的待識別區域;確定所述待識別區域與所述原始圖像的面積占比;確定所述待識別區域與預設方向的角度;確定所述待識別區域的文字密度;響應于所述面積占比大于占比閾值、所述角度小于角度閾值,以及所述文字密度小于密度閾值,對所述待識別區域內的文字進行文字識別。如此,提高了文字識別的有效性。
技術領域
本公開涉及計算機圖像處理技術領域,尤其涉及文字識別方法、裝置、電子設備及存儲介質。
背景技術
相關技術中,通常采用OCR光學字符識別技術對圖像中的文字進行識別,但是通過OCR技術進行文字識別時,會將圖像中出現的所有文字進行識別。而對于一些圖像,特別是從一些特定的視頻中抽取的圖像中會出現較多的噪聲文字,例如廣告視頻中可能會出現的未突出顯示的產品的成分表或者應用界面內的文字非廣告需要突出的文字等,如果利用OCR技術進行文字識別的話,同樣會將這些噪聲文字識別出來,從而使得得到的文字信息的有效性不高。因此,如何提高文字識別的有效性成為了亟需解決的技術問題。
發明內容
本公開提供一種文字識別方法、裝置、電子設備及存儲介質。
根據本公開實施例的第一方面,提供一種文字識別方法,應用于電子設備,包括:
對獲取的原始圖像進行圖像處理,得到包含文字的待識別區域;
確定所述待識別區域與所述原始圖像的面積占比;
確定所述待識別區域與預設方向的角度;
確定所述待識別區域的文字密度;
響應于所述面積占比大于占比閾值、所述角度小于角度閾值,以及所述文字密度小于密度閾值,對所述待識別區域內的文字進行文字識別。
可選地,所述方法還包括:
確定所述待識別區域內各像素點的第一平均灰度值,以及所述待識別區域向外延伸的預設區域內的各像素點的第二平均灰度值;
根據所述第一平均灰度值及所述第二平均灰度值,確定二值化閾值;
所述對所述待識別區域內的文字進行文字識別,包括:
根據所述二值化閾值對所述待識別區域進行二值化處理,對二值化處理后的所述待識別區域內的文字進行文字識別。
可選地,所述確定所述待識別區域與所述原始圖像的面積占比,包括:
確定所述待識別區域的最大內接矩形;
根據所述最大內接矩形的面積,確定所述待識別區域的面積;
根據所述待識別區域的面積,確定所述待識別區域與所述原始圖像的所述米娜及占比。
可選地,所述方法還包括:
確定所述待識別區域的高度與寬度;
所述響應于所述面積占比大于占比閾值、所述角度小于角度閾值,以及所述文字密度小于密度閾值,對所述待識別區域內的文字進行文字識別,包括:
響應于所述高度大于高度閾值和/或所述寬度大于寬度閾值,且所述面積占比大于占比閾值、所述角度小于角度閾值,對所述待識別區域內的文字進行文字識別。
可選地,所述確定所述待識別區域內的文字密度,包括:
確定所述待識別區域內的文字個數;
根據所述文字個數,確定所述待識別區域的所述文字密度。
可選地,所述確定所述待識別區域內的文字個數,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司;北京小米松果電子有限公司,未經北京小米移動軟件有限公司;北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110265269.2/2.html,轉載請聲明來源鉆瓜專利網。





