[發明專利]字符識別方法、字符譯碼模型的訓練方法及電子設備有效

申請號：	202010591459.9	申請日：	2020-06-24
公開（公告）號：	CN111738248B	公開（公告）日：	2022-07-29
發明（設計）人：	蔡嘯;晉兆龍;肖瀟	申請（專利權）人：	蘇州科達科技股份有限公司
主分類號：	G06V30/10	分類號：	G06V30/10;G06V30/18;G06V30/19;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京三聚陽光知識產權代理有限公司 11250	代理人：	張琳琳
地址：	215011 江***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	字符識別方法譯碼模型訓練電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種字符識別方法，其特征在于，包括：

獲取目標字符圖像以及預設字典；其中，所述預設字典中包括多個預設詞組；

將所述目標字符圖像輸入字符譯碼模型中，以使得所述字符譯碼模型利用所述預設字典輸出字符序列；

基于所述多個預設詞組，依次對所述字符序列中預設長度的連續字符進行詞組驗證，以得到目標字符序列；

所述字符譯碼模型的輸出還包括所述字符序列中各個字符對應于所述預設字典中各個字符的概率；其中，所述基于所述多個預設詞組，依次對所述字符序列中預設長度的連續字符進行詞組驗證，以得到目標字符序列，包括：

提取所述多個預設詞組中以所述預設長度的連續字符中的第一字符開始且長度為所述預設長度的詞組；

利用所述字符序列中各個字符對應于所述預設字典中各個字符的概率，計算所述字符序列中所述預設長度的連續字符的第一聯合后驗概率值以及各個所述預設長度的詞組的第二聯合后驗概率值；

基于所述第一聯合后驗概率值以及所有所述第二聯合后驗概率值，確定所述預設長度的連續字符對應的目標詞組。

2.根據權利要求1所述的方法，其特征在于，所述基于所述第一聯合后驗概率值以及所有所述第二聯合后驗概率值，確定所述預設長度的連續字符對應的目標詞組，包括：

獲取預設加權值；

計算所述預設加權值與各個所述第二聯合后驗概率值的乘積，得到各個加權處理后的第二聯合后驗概率值；

依次對比所述第一聯合后驗概率值與所述各個加權處理后的第二聯合后驗概率值，確定所述目標詞組。

3.根據權利要求1所述的方法，其特征在于，所述將所述目標字符圖像輸入字符譯碼模型中，以使得所述字符譯碼模型利用所述預設字典輸出字符序列，包括：

將所述目標字符圖像輸入所述字符譯碼模型中的特征提取模塊中進行特征提取，輸出第一特征序列；

將所述第一特征序列輸入所述字符譯碼模型中的循環神經網絡模塊中進行關聯處理，輸出第二特征序列；

對所述第二特征序列進行譯碼得到所述字符序列。

4.根據權利要求3所述的方法，其特征在于，所述循環神經網絡模塊為雙層殘差雙向長短期記憶模塊；每層殘差雙向長短期記憶模塊分為并行的3個支路，所述每層殘差雙向長短期記憶模塊的輸出序列為所述3個支路對應輸出序列的疊加；其中，第一支路依次包括第一反向層、第一長短期記憶單元以及第二反向層，第二支路為所述殘差雙向長短期記憶模塊輸入端與輸出端的連接，第三支路包括第二長短期記憶單元。

5.根據權利要求1所述的方法，其特征在于，所述獲取目標字符圖像，包括：

獲取目標圖像；

將所述目標圖像輸入字符檢測模塊中，輸出所述目標圖像中字符文本行的位置信息；

基于所述字符文本行的位置信息從所述目標圖像中提取所述字符文本行對應的圖像，以得到所述目標字符圖像。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于蘇州科達科技股份有限公司，未經蘇州科達科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010591459.9/1.html，轉載請聲明來源鉆瓜專利網。