[發明專利]字符識別方法和裝置、用于字符識別的裝置有效
| 申請號: | 201711250089.7 | 申請日: | 2017-12-01 |
| 公開(公告)號: | CN109871843B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 馬龍;許盛輝;徐露露;蘇雪峰;佟子健 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V30/146;G06V10/26;G06V30/148;G06V10/46;G06V10/82;G06N3/04 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 方法 裝置 用于 | ||
本發明實施例提供了一種字符識別方法和裝置、用于字符識別的裝置,其中的方法具體包括:針對包含行字符的行字符圖像,進行尺寸歸一化;利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,以得到所述歸一化后的行字符圖像對應的特征信息;利用雙向長短期記憶神經網絡,對所述特征信息進行字符識別,以得到所述行字符圖像對應的行字符識別結果。本發明實施例可以可以提高行字符識別結果的精確度。
技術領域
本發明涉及OCR(光學字符識別,Optical Character Recognition)技術領域,特別是涉及一種字符識別方法和裝置、以及一種用于字符識別的裝置。
背景技術
隨著移動互聯網的發展,OCR技術的應用場景也從傳統的辦公領域(例如郵政編碼、書籍掃描文檔傳真)逐漸滲入用戶的日常生活,例如,若用戶將手機攝像頭對準菜單上的法語菜名,則通過OCR技術,可以在屏幕上顯示出翻譯好的中文菜名;或者,通過OCR技術將圖書館的藏書轉化為電子書,等等。
目前的OCR技術可以從包含字符的原始圖像中獲取行字符圖像,并針對該行字符圖像進行字符識別,以將該行字符圖像轉化為文本。針對該行字符圖像進行字符識別的過程可以包括:將行字符圖像切分為單字圖像,識別各單字圖像對應的字符,并對各單字圖像對應的字符進行拼接。
然而,在實際應用中,將行字符圖像切分為單字圖像的過程中容易出現切分錯誤,該切分錯誤將影響行字符識別結果的精確度。尤其地,對于一些復雜的藝術體字符或者潦草的手寫體字符而言,行字符圖像中往往存在字符之間粘連的情況,此種情況將增加將行字符圖像切分為單字圖像的難度,進而增加切分錯誤對應的錯誤率。
發明內容
鑒于上述問題,提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的字符識別方法、字符識別裝置、用于字符識別的裝置,本發明實施例可以提高行字符識別結果的精確度。
為了解決上述問題,本發明實施例公開了一種字符識別方法,包括:
針對包含行字符的行字符圖像,進行尺寸歸一化;
利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,以得到所述歸一化后的行字符圖像對應的特征信息;
利用雙向長短期記憶神經網絡,對所述特征信息進行字符識別,以得到所述行字符圖像對應的行字符識別結果。
可選地,所述卷積神經網絡包括:P個相互連接的開端層,所述P個開端層中的至少一個包括:卷積核和池化模塊,上一所述開端層的輸出為下一所述開端層的輸入;P為大于1的自然數。
可選地,所述利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,包括:
利用卷積神經網絡對歸一化后的行字符圖像進行特征提取,得到N個特征圖;N為大于1的自然數;
對所述N個特征圖按列拼接,以得到所述歸一化后的行字符圖像對應的特征信息。
可選地,所述歸一化后的行字符圖像對應有第一尺寸,所述特征圖對應有第二尺寸,所述第一尺寸對于所述第二尺寸的比值范圍為4~8。
可選地,所述雙向長短期記憶神經網絡包括:M個雙向長短期記憶神經網絡層,M為自然數;
所述M個雙向長短期記憶神經網絡層對時間態的特征信息進行處理,上一所述雙向長短期記憶神經網絡層的輸出為下一所述雙向長短期記憶神經網絡層的輸入。
可選地,所述雙向長短期記憶神經網絡還包括:全鏈接層;
所述全鏈接層依據最后一個雙向長短期記憶神經網絡層輸出的特征,得到所述行字符圖像對應字符的概率,并依據所述概率得到所述行字符圖像對應的字符識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711250089.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:組合儀表圖像采集系統
- 下一篇:一種拍攝小票圖像文本矯正和提取方法





