[發明專利]漢字模型訓練方法、漢字識別方法、裝置、設備及介質在審
| 申請號: | 201810563512.7 | 申請日: | 2018-06-04 |
| 公開(公告)號: | CN108710866A | 公開(公告)日: | 2018-10-26 |
| 發明(設計)人: | 吳啟;周罡 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 胡志桐 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手寫 模型訓練 訓練樣本 字體圖像 準確率 循環神經網絡 漢字識別 漢字 測試集 訓練集 卷積 預設 二級字庫 反向傳播 分配規則 時間分類 算法更新 權值和 字圖像 偏置 算法 標注 中文 | ||
本發明公開了一種漢字模型訓練方法、漢字識別方法、裝置、設備及介質,該漢字模型訓練方法,包括:獲取字體圖像訓練樣本,采用中文二級字庫對字體圖像訓練樣本中的手寫字圖像進行標注,并按預設分配規則將字體圖像訓練樣本分為訓練集和測試集;將訓練集輸入到卷積循環神經網絡模型中,采用基于連續時間分類算法的反向傳播算法更新卷積循環神經網絡模型中的權值和偏置,獲取初始手寫字識別模型;將測試集輸入到初始手寫字識別模型中,獲取識別準確率,若識別準確率大于預設準確率,則確定初始手寫字識別模型為目標手寫字識別模型。該目標手寫字識別模型可以較準確地識別手寫字。
技術領域
本發明涉及手寫字識別領域,尤其涉及一種漢字模型訓練方法、漢字識別方法、裝置、設備及介質。
背景技術
傳統漢字的識別方法大多會采用OCR(Optical Character Recognition,光學字符識別)技術進行識別。由于漢字的類別繁多,比如“宋體、楷體、姚體和仿宋”,而且部分漢字的結構比較復雜,比如“魑、魅”,并且漢字中存在著較多的結構相似的字,比如“受和愛”,使得漢字識別準確性無法保證。對標準的、書寫簡單且規范的句子,采用OCR(光學字符識別)技術可以識別,但是對于手寫的字組成的句子,由于每個人的書寫習慣不相同且不是標準的橫豎撇捺組成的漢字,采用OCR技術識別時,會存在識別不準確的情況,極大限制了識別系統的性能,造成識別的精確度不高,使得識別效果不理想。
發明內容
基于此,有必要針對上述技術問題,提供一種可以提高識別準確度的漢字模型訓練方法、裝置、設備及介質。
一種漢字模型訓練方法,包括:
初始化卷積循環神經網絡模型的權值和偏置;
獲取字體圖像訓練樣本,采用中文二級字庫對所述字體圖像訓練樣本中的手寫字圖像進行標注,并按預設分配規則將所述字體圖像訓練樣本分為訓練集和測試集;
將所述訓練集輸入到卷積循環神經網絡模型中,獲取卷積循環神經網絡模型的前向輸出和后向輸出,根據所述卷積循環神經網絡模型的前向輸出和后向輸出,采用基于連續時間分類算法的反向傳播算法更新所述卷積循環神經網絡模型中的權值和偏置,獲取初始手寫字識別模型;
將所述測試集輸入到所述初始手寫字識別模型中,獲取識別準確率,若所述識別準確率大于預設準確率,則確定所述初始手寫字識別模型為目標手寫字識別模型。
一種漢字模型訓練裝置,包括:
模型初始化模塊,用于初始化卷積循環神經網絡模型的權值和偏置;
訓練樣本處理模塊,用于獲取字體圖像訓練樣本,采用中文二級字庫對所述字體圖像訓練樣本中的手寫字圖像進行標注,并按預設分配規則將所述字體圖像訓練樣本分為訓練集和測試集;
初始模型獲取模塊,用于將所述訓練集輸入到卷積循環神經網絡模型中,獲取卷積循環神經網絡模型的前向輸出和后向輸出,根據所述卷積循環神經網絡模型的前向輸出和后向輸出,采用基于連續時間分類算法的反向傳播算法更新所述卷積循環神經網絡模型中的權值和偏置,獲取初始手寫字識別模型;
目標模型獲取模塊,用于將所述測試集輸入到所述初始手寫字識別模型中,獲取識別準確率,若所述識別準確率大于預設準確率,則確定所述初始手寫字識別模型為目標手寫字識別模型。
一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述漢字模型訓練方法的步驟。
一種非易失性存儲介質,所述非易失性存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述漢字模型訓練方法的步驟。
基于此,有必要針對上述技術問題,提供一種識別準確度較高的漢字識別方法、裝置、設備及介質。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810563512.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于神經網絡的司機異常行為檢測方法
- 下一篇:車位導航方法及相關產品





