[發明專利]字符識別方法和裝置、用于字符識別的裝置有效
| 申請號: | 201711250089.7 | 申請日: | 2017-12-01 |
| 公開(公告)號: | CN109871843B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 馬龍;許盛輝;徐露露;蘇雪峰;佟子健 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V30/146;G06V10/26;G06V30/148;G06V10/46;G06V10/82;G06N3/04 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 方法 裝置 用于 | ||
1.一種字符識別方法,其特征在于,所述方法包括:
針對包含行字符的行字符圖像,進行尺寸歸一化;
利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,以得到所述歸一化后的行字符圖像對應的特征信息;
利用雙向長短期記憶神經網絡,對所述特征信息進行字符識別,以得到所述行字符圖像對應的行字符識別結果;
所述特征提取用于針對所述行字符圖像沿水平方向形成若干切片,每個切片對應有特征信息,所述字符識別用于利用雙向長短期記憶神經網絡,得到所述切片對應的上下文特征,并確定所述切片對應的行字符識別結果;所述上下文特征用于確定相鄰的切片之間的邊界、以及所述切片到字符的概率;所述上下文特征包括:顏色分布特征、紋理特征、邊界特征和角點特征。
2.根據權利要求1所述的方法,其特征在于,所述卷積神經網絡包括:P個相互連接的開端層,P個開端層中的至少一個包括:卷積核和池化模塊,上一所述開端層的輸出為下一所述開端層的輸入;P為大于1的自然數。
3.根據權利要求1或2所述的方法,其特征在于,所述利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,包括:
利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,得到N個特征圖;N為大于1的自然數;
對所述N個特征圖按列拼接,以得到所述歸一化后的行字符圖像對應的特征信息。
4.根據權利要求3所述的方法,其特征在于,所述歸一化后的行字符圖像對應有第一尺寸,所述特征圖對應有第二尺寸,所述第一尺寸對于所述第二尺寸的比值范圍為4~8。
5.根據權利要求1或2所述的方法,其特征在于,所述雙向長短期記憶神經網絡包括:M個雙向長短期記憶神經網絡層,M為自然數;
所述M個雙向長短期記憶神經網絡層對時間態的特征信息進行處理,上一所述雙向長短期記憶神經網絡層的輸出為下一所述雙向長短期記憶神經網絡層的輸入。
6.根據權利要求5所述的方法,其特征在于,所述雙向長短期記憶神經網絡還包括:全鏈接層;
所述全鏈接層依據最后一個雙向長短期記憶神經網絡層輸出的特征,得到所述行字符圖像對應字符的概率,并依據所述概率得到所述行字符圖像對應的字符識別結果。
7.根據權利要求1或2所述的方法,其特征在于,所述歸一化后的行字符圖像對應有第一尺寸,所述第一尺寸包括高度尺寸,所述高度尺寸對應的像素值為偶數。
8.根據權利要求7所述的方法,其特征在于,所述高度尺寸對應的像素值范圍為40~64像素。
9.一種字符識別裝置,其特征在于,包括:
歸一化模塊,用于針對包含行字符的行字符圖像,進行尺寸歸一化;
特征提取模塊,用于利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,以得到所述歸一化后的行字符圖像對應的特征信息;以及
字符識別模塊,用于利用雙向長短期記憶神經網絡,對所述特征信息進行字符識別,以得到所述行字符圖像對應的行字符識別結果;
所述特征提取用于針對所述行字符圖像沿水平方向形成若干切片,每個切片對應有特征信息,所述字符識別用于利用雙向長短期記憶神經網絡,得到所述切片對應的上下文特征,并確定所述切片對應的行字符識別結果;所述上下文特征用于確定相鄰的切片之間的邊界、以及所述切片到字符的概率;所述上下文特征包括:顏色分布特征、紋理特征、邊界特征和角點特征。
10.根據權利要求9所述的裝置,其特征在于,所述卷積神經網絡包括:P個相互連接的開端層,P個開端層中的至少一個包括:卷積核和池化模塊,上一所述開端層的輸出為下一所述開端層的輸入;P為大于1的自然數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711250089.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:組合儀表圖像采集系統
- 下一篇:一種拍攝小票圖像文本矯正和提取方法





