[發明專利]一種文字識別方法、裝置及電子設備有效
| 申請號: | 201610942164.5 | 申請日: | 2016-10-25 |
| 公開(公告)號: | CN107977659B | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 陳蘇 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/68 |
| 代理公司: | 北京華沛德權律師事務所 11302 | 代理人: | 馬苗苗 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 識別 方法 裝置 電子設備 | ||
1.一種文字識別方法,其特征在于,包括:
對待識別圖像進行預處理,獲得僅包含文字的目標圖像;
提取所述目標圖像中的文字;
針對提取到的每個文字,獲得所述每個文字的連通特征;
針對所述每個文字,分別提取構成文字的所有像素點中各行橫坐標及各列縱坐標的最大和最小的像素點,構成所述每個文字的輪廓特征;
根據已建立的字模庫,以及所述每個文字的所述連通特征和所述輪廓特征,對所述每個文字進行識別。
2.如權利要求1所述的方法,其特征在于,所述提取所述目標圖像中的文字,包括:
根據所述目標圖像中文字的分隔條件,獲得所述每個文字所在的第一區域;
在所述第一區域中,獲得表征文字的像素點橫坐標及縱坐標的最大和最小的頂點坐標點
提取由所述頂點坐標點構成的矩形區域中的所有像素點組成的圖像作為所述第一區域中的文字。
3.如權利要求2所述的方法,其特征在于,所述根據所述目標圖像中文字的分隔條件,獲得所述每個文字所在的第一區域,包括:
獲得所述目標圖像中至少一列全為背景像素點的分割線;
根據所述目標圖像左右兩側背景的背景寬度,獲得所述目標圖像中所有文字所在的第二區域;
在所述第二區域中,根據文字最小寬度以及所述分割線,獲得所述每個文字所在的第一區域。
4.如權利要求1所述的方法,其特征在于,所述針對提取到的每個文字,獲得所述每個文字的連通特征,包括:
獲得所述每個文字中各表征文字的連續像素點構成的連通部分,及所述連通部分的屬性信息;
將所有的所述連通部分和所述連通部分的屬性信息作為所述連通特征。
5.如權利要求4所述的方法,其特征在于,所述連通部分的屬性信息包括以下至少一種信息:各連通部分的相對位置信息,各連通部分的像素點數,各連通部分包含的筆畫,以及各連通部分的邊緣梯度值。
6.如權利要求5所述的方法,其特征在于,當所述文字為漢字時,所述各連通部分包含的筆畫通過如下方法獲得:
基于表征文字的像素點構成的直線的方向角度,獲得筆畫:橫、豎;
基于表征文字的像素點擬合成的直線的方向角度和長度,獲得筆畫:、撇、捺、折、點。
7.如權利要求1~6任一所述的方法,其特征在于,所述根據已建立的字模庫,以及所述每個文字的所述連通特征和所述輪廓特征,對所述每個文字進行識別,包括:
根據已建立的字模庫,以及所述每個文字的所述連通特征和所述輪廓特征,對所述每個文字進行模式識別。
8.如權利要求1~6任一所述的方法,其特征在于,所述根據已建立的字模庫,以及所述每個文字的所述連通特征和所述輪廓特征,對所述每個文字進行識別,包括:
獲得構成所述輪廓特征的像素點的圖像梯度值;
根據已建立的字模庫、所述每個文字的所述連通特征、所述輪廓特征及所述圖像梯度值,對所述每個文字進行識別。
9.如權利要求1~6任一所述的方法,其特征在于,所述方法還包括:
若已建立的字模庫中不存在與所述連通特征和所述輪廓特征匹配的文字,將所述連通特征和所述輪廓特征及其所構成的文字添加到所述字模庫中。
10.一種文字識別裝置,其特征在于,所述裝置包括:
預處理模塊,用于對待識別圖像進行預處理,獲得僅包含文字的目標圖像;
第一提取模塊,用于提取所述目標圖像中的文字;
第二提取模塊,用于針對提取到的每個文字,獲得所述每個文字的連通特征;
第三提取模塊,用于針對所述每個文字,分別提取構成文字的所有像素點中各行橫坐標及各列縱坐標的最大和最小的像素點,構成所述每個文字的輪廓特征;
識別模塊,用于根據已建立的字模庫,以及所述每個文字的所述連通特征和所述輪廓特征,對所述每個文字進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610942164.5/1.html,轉載請聲明來源鉆瓜專利網。





