[發明專利]文字識別方法、裝置、電子設備及存儲介質在審

申請號：	202110265269.2	申請日：	2021-03-11
公開（公告）號：	CN112906686A	公開（公告）日：	2021-06-04
發明（設計）人：	王棟	申請（專利權）人：	北京小米移動軟件有限公司;北京小米松果電子有限公司
主分類號：	G06K9/20	分類號：	G06K9/20;G06K9/34
代理公司：	北京善任知識產權代理有限公司 11650	代理人：	張振偉
地址：	100085 北京市海淀***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	文字識別方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種文字識別方法，其特征在于，包括：

對獲取的原始圖像進行圖像處理，得到包含文字的待識別區域；

確定所述待識別區域與所述原始圖像的面積占比；

確定所述待識別區域與預設方向的角度；

確定所述待識別區域的文字密度；

響應于所述面積占比大于占比閾值、所述角度小于角度閾值，以及所述文字密度小于密度閾值，對所述待識別區域內的文字進行文字識別。

2.根據權利要求1所述的方法，其特征在于，所述方法還包括：

確定所述待識別區域內各像素點的第一平均灰度值，以及所述待識別區域向外延伸的預設區域內的各像素點的第二平均灰度值；

根據所述第一平均灰度值及所述第二平均灰度值，確定二值化閾值；

所述對所述待識別區域內的文字進行文字識別，包括：

根據所述二值化閾值對所述待識別區域進行二值化處理，對二值化處理后的所述待識別區域內的文字進行文字識別。

3.根據權利要求1所述的方法，其特征在于，所述確定所述待識別區域與所述原始圖像的面積占比，包括：

確定所述待識別區域的最大內接矩形；

根據所述最大內接矩形的面積，確定所述待識別區域的面積；

根據所述待識別區域的面積，確定所述待識別區域與所述原始圖像的所述面積占比。

4.根據權利要求1所述的方法，其特征在于，所述方法還包括：

確定所述待識別區域的高度與寬度；

所述響應于所述面積占比大于占比閾值、所述角度小于角度閾值，以及所述文字密度小于密度閾值，對所述待識別區域內的文字進行文字識別，包括：

響應于所述高度大于高度閾值和/或所述寬度大于寬度閾值，且所述面積占比大于占比閾值、所述角度小于角度閾值，以及所述文字密度小于密度閾值，對所述待識別區域內的文字進行文字識別。

5.根據權利要求1或4所述的方法，其特征在于，所述確定所述待識別區域內的文字密度，包括：

確定所述待識別區域內的文字個數；

根據所述文字個數，確定所述待識別區域的所述文字密度。

6.根據權利要求5所述的方法，其特征在于，所述確定所述待識別區域內的文字個數，包括：

將所述待識別區域向設置方向進行投影，得到投影區域，其中，所述設置方向為所述待識別區域內的文字所在的行的方向；

確定所述投影區域的像素密度分布；

根據所述像素密度分度，確定所述待識別區域的文字個數。

7.根據權利要求1所述的方法，其特征在于，所述方法還包括：

按照抽幀周期，從待處理視頻中抽取當前所述抽幀周期對應的幀圖像，作為所述原始圖像。

8.根據權利要求7所述的方法，其特征在于，所述方法還包括：

根據所述待處理視頻的總時長，確定所述軸幀周期。

9.根據權利要求1所述的方法，其特征在于，所述對所述待識別區域內的文字進行文字識別，包括：

對所述待識別區域的文字進行光學字符識別，得到第一文字信息；

對所述第一文字信息進行糾錯處理，得到第二文字信息。

10.一種文字識別裝置，其特征在于，包括：

得到模塊，用于對獲取的原始圖像進行圖像處理，得到包含文字的待識別區域；

第一確定模塊，用于確定所述待識別區域與所述原始圖像的面積占比；

第二確定模塊，用于確定所述待識別區域與預設方向的角度；

第三確定模塊，用于確定所述待識別區域的文字密度；

識別模塊，用于響應于所述面積占比大于占比閾值、所述角度小于角度閾值，以及所述文字密度小于密度閾值，對所述待識別區域內的文字進行文字識別。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司;北京小米松果電子有限公司，未經北京小米移動軟件有限公司;北京小米松果電子有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110265269.2/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種隧道用土壓力盒埋設裝置及使用方法
下一篇：一種大光束口徑高功率隔離器結構

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06K 數據識別；數據表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復掃描圖形的方法
G06K9-18 .應用具有附加代碼標記或含有代碼標記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預處理，即無須判定關于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】