[發明專利]手寫模型訓練方法、文本識別方法、裝置、設備及介質有效
| 申請號: | 201810564059.1 | 申請日: | 2018-06-04 |
| 公開(公告)號: | CN109002461B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 孫強;周罡 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06V30/413;G06N3/0442;G06N3/084 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 胡志桐 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手寫 模型 訓練 方法 文本 識別 裝置 設備 介質 | ||
本發明公開了一種手寫模型訓練方法、文本識別方法、裝置、設備及介質。該手寫模型訓練方法包括:獲取規范中文文本訓練樣本,將所述規范中文文本訓練樣本輸入到雙向長短時記憶神經網絡中,基于連續時間分類算法進行訓練,獲取總誤差因子,并根據總誤差因子采用粒子群算法更新網絡參數,獲取規范中文文本識別模型;獲取并采用非規范中文文本訓練樣本,訓練獲取調整中文手寫文本識別模型;獲取并采用待測試中文文本樣本得到出錯文本訓練樣本;采用出錯文本訓練樣本更新中文手寫文本識別模型的網絡參數,獲取目標中文手寫文本識別模型。采用該手寫模型訓練方法,能夠得到識別手寫文本識別率高的目標中文手寫文本識別模型。
技術領域
本發明涉及中文文本識別領域,尤其涉及一種手寫模型訓練方法、文本識別方法、裝置、設備及介質。
背景技術
采用傳統文本識別方法在識別較為潦草的非規范文本(手寫中文文本)時,識別的精確度不高,使得其識別效果不理想。傳統文本識別方法很大程度上只能識別規范文本,對實際生活中各種各樣的手寫文本進行識別時,準確率較低。
發明內容
本發明實施例提供一種手寫模型訓練方法、裝置、設備及介質,以解決當前手寫中文文本識別準確率不高的問題。
一種手寫模型訓練方法,包括:
獲取規范中文文本訓練樣本,將所述規范中文文本訓練樣本輸入到雙向長短時記憶神經網絡中,基于連續時間分類算法進行訓練,獲取雙向長短時記憶神經網絡的總誤差因子,根據雙向長短時記憶神經網絡的總誤差因子,采用粒子群算法更新雙向長短時記憶神經網絡的網絡參數,獲取規范中文文本識別模型;
獲取非規范中文文本訓練樣本,將所述非規范中文文本訓練樣本輸入到所述規范中文文本識別模型中,基于連續時間分類算法進行訓練,獲取規范中文文本識別模型的總誤差因子,根據規范中文文本識別模型的總誤差因子,采用粒子群算法更新所述規范中文文本識別模型的網絡參數,獲取調整中文手寫文本識別模型;
獲取待測試中文文本樣本,采用所述調整中文手寫文本識別模型識別所述待測試中文文本樣本,獲取識別結果與真實結果不符的出錯文本,把所有所述出錯文本作為出錯文本訓練樣本;
將所述出錯文本訓練樣本輸入到所述調整中文手寫文本識別模型中,基于連續時間分類算法進行訓練,獲取調整中文手寫文本識別模型的總誤差因子,根據調整中文手寫文本識別模型的總誤差因子,采用粒子群算法更新調整中文手寫文本識別模型的網絡參數,獲取目標中文手寫文本識別模型。
一種手寫模型訓練裝置,包括:
規范中文文本識別模型獲取模塊,用于獲取規范中文文本訓練樣本,將所述規范中文文本訓練樣本輸入到雙向長短時記憶神經網絡中,基于連續時間分類算法進行訓練,獲取雙向長短時記憶神經網絡的總誤差因子,根據雙向長短時記憶神經網絡的總誤差因子,采用粒子群算法更新雙向長短時記憶神經網絡的網絡參數,獲取規范中文文本識別模型;
調整中文手寫文本識別模型獲取模塊,用于獲取非規范中文文本訓練樣本,將所述非規范中文文本訓練樣本輸入到所述規范中文文本識別模型中,基于連續時間分類算法進行訓練,獲取規范中文文本識別模型的總誤差因子,根據規范中文文本識別模型的總誤差因子,采用粒子群算法更新所述規范中文文本識別模型的網絡參數,獲取調整中文手寫文本識別模型;
出錯文本訓練樣本獲取模塊,用于獲取待測試中文文本樣本,采用所述調整中文手寫文本識別模型識別所述待測試中文文本樣本,獲取識別結果與真實結果不符的出錯文本,把所有所述出錯文本作為出錯文本訓練樣本;
目標中文手寫文本識別模型獲取模塊,用于將所述出錯文本訓練樣本輸入到所述調整中文手寫文本識別模型中,基于連續時間分類算法進行訓練,獲取調整中文手寫文本識別模型的總誤差因子,根據調整中文手寫文本識別模型的總誤差因子,采用粒子群算法更新調整中文手寫文本識別模型的網絡參數,獲取目標中文手寫文本識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810564059.1/2.html,轉載請聲明來源鉆瓜專利網。





