[發明專利]文字識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110265269.2 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN112906686A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 王棟 | 申請(專利權)人: | 北京小米移動軟件有限公司;北京小米松果電子有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34 |
| 代理公司: | 北京善任知識產權代理有限公司 11650 | 代理人: | 張振偉 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種文字識別方法,其特征在于,包括:
對獲取的原始圖像進行圖像處理,得到包含文字的待識別區域;
確定所述待識別區域與所述原始圖像的面積占比;
確定所述待識別區域與預設方向的角度;
確定所述待識別區域的文字密度;
響應于所述面積占比大于占比閾值、所述角度小于角度閾值,以及所述文字密度小于密度閾值,對所述待識別區域內的文字進行文字識別。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
確定所述待識別區域內各像素點的第一平均灰度值,以及所述待識別區域向外延伸的預設區域內的各像素點的第二平均灰度值;
根據所述第一平均灰度值及所述第二平均灰度值,確定二值化閾值;
所述對所述待識別區域內的文字進行文字識別,包括:
根據所述二值化閾值對所述待識別區域進行二值化處理,對二值化處理后的所述待識別區域內的文字進行文字識別。
3.根據權利要求1所述的方法,其特征在于,所述確定所述待識別區域與所述原始圖像的面積占比,包括:
確定所述待識別區域的最大內接矩形;
根據所述最大內接矩形的面積,確定所述待識別區域的面積;
根據所述待識別區域的面積,確定所述待識別區域與所述原始圖像的所述面積占比。
4.根據權利要求1所述的方法,其特征在于,所述方法還包括:
確定所述待識別區域的高度與寬度;
所述響應于所述面積占比大于占比閾值、所述角度小于角度閾值,以及所述文字密度小于密度閾值,對所述待識別區域內的文字進行文字識別,包括:
響應于所述高度大于高度閾值和/或所述寬度大于寬度閾值,且所述面積占比大于占比閾值、所述角度小于角度閾值,以及所述文字密度小于密度閾值,對所述待識別區域內的文字進行文字識別。
5.根據權利要求1或4所述的方法,其特征在于,所述確定所述待識別區域內的文字密度,包括:
確定所述待識別區域內的文字個數;
根據所述文字個數,確定所述待識別區域的所述文字密度。
6.根據權利要求5所述的方法,其特征在于,所述確定所述待識別區域內的文字個數,包括:
將所述待識別區域向設置方向進行投影,得到投影區域,其中,所述設置方向為所述待識別區域內的文字所在的行的方向;
確定所述投影區域的像素密度分布;
根據所述像素密度分度,確定所述待識別區域的文字個數。
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
按照抽幀周期,從待處理視頻中抽取當前所述抽幀周期對應的幀圖像,作為所述原始圖像。
8.根據權利要求7所述的方法,其特征在于,所述方法還包括:
根據所述待處理視頻的總時長,確定所述軸幀周期。
9.根據權利要求1所述的方法,其特征在于,所述對所述待識別區域內的文字進行文字識別,包括:
對所述待識別區域的文字進行光學字符識別,得到第一文字信息;
對所述第一文字信息進行糾錯處理,得到第二文字信息。
10.一種文字識別裝置,其特征在于,包括:
得到模塊,用于對獲取的原始圖像進行圖像處理,得到包含文字的待識別區域;
第一確定模塊,用于確定所述待識別區域與所述原始圖像的面積占比;
第二確定模塊,用于確定所述待識別區域與預設方向的角度;
第三確定模塊,用于確定所述待識別區域的文字密度;
識別模塊,用于響應于所述面積占比大于占比閾值、所述角度小于角度閾值,以及所述文字密度小于密度閾值,對所述待識別區域內的文字進行文字識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司;北京小米松果電子有限公司,未經北京小米移動軟件有限公司;北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110265269.2/1.html,轉載請聲明來源鉆瓜專利網。





