[發明專利]手寫模型訓練方法、文本識別方法、裝置、設備及介質有效
| 申請號: | 201810564059.1 | 申請日: | 2018-06-04 |
| 公開(公告)號: | CN109002461B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 孫強;周罡 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06V30/413;G06N3/0442;G06N3/084 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 胡志桐 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手寫 模型 訓練 方法 文本 識別 裝置 設備 介質 | ||
1.一種手寫模型訓練方法,其特征在于,包括:
獲取規范中文文本訓練樣本,將所述規范中文文本訓練樣本輸入到雙向長短時記憶神經網絡中,基于連續時間分類算法進行訓練,獲取雙向長短時記憶神經網絡的總誤差因子,根據雙向長短時記憶神經網絡的總誤差因子,采用粒子群算法更新雙向長短時記憶神經網絡的網絡參數,獲取規范中文文本識別模型;
獲取非規范中文文本訓練樣本,將所述非規范中文文本訓練樣本輸入到所述規范中文文本識別模型中,基于連續時間分類算法進行訓練,獲取規范中文文本識別模型的總誤差因子,根據規范中文文本識別模型的總誤差因子,采用粒子群算法更新所述規范中文文本識別模型的網絡參數,獲取調整中文手寫文本識別模型;
獲取待測試中文文本樣本,采用所述調整中文手寫文本識別模型識別所述待測試中文文本樣本,獲取識別結果與真實結果不符的出錯文本,把所有所述出錯文本作為出錯文本訓練樣本;
將所述出錯文本訓練樣本輸入到所述調整中文手寫文本識別模型中,基于連續時間分類算法進行訓練,獲取調整中文手寫文本識別模型的總誤差因子,根據調整中文手寫文本識別模型的總誤差因子,采用粒子群算法更新調整中文手寫文本識別模型的網絡參數,獲取目標中文手寫文本識別模型。
2.根據權利要求1所述的手寫模型訓練方法,其特征在于,所述獲取規范中文文本訓練樣本,包括:
獲取待處理中文文本訓練樣本中每個中文文本的像素值特征矩陣,將每個中文文本的像素值特征矩陣中每個像素值進行歸一化處理,獲取每個中文文本的歸一化像素值特征矩陣,其中,歸一化處理的公式為MaxValue為所述像素值特征矩陣中像素值的最大值,MinValue為所述像素值特征矩陣中像素值的最小值,x為歸一化前的像素值,y為歸一化后的像素值;
將每個中文文本的歸一化像素值特征矩陣中的像素值劃分為兩類像素值,基于所述兩類像素值建立每個中文文本的二值化像素值特征矩陣,將每個中文文本的二值化像素值特征矩陣對應的中文文本組合作為規范中文文本訓練樣本。
3.根據權利要求1所述的手寫模型訓練方法,其特征在于,所述將所述規范中文文本訓練樣本輸入到雙向長短時記憶神經網絡中,基于連續時間分類算法進行訓練,獲取雙向長短時記憶神經網絡的總誤差因子,根據雙向長短時記憶神經網絡的總誤差因子,采用粒子群算法更新雙向長短時記憶神經網絡的網絡參數,獲取規范中文文本識別模型,包括:
將所述規范中文文本訓練樣本按序列正向輸入到雙向長短時記憶神經網絡中,基于連續時間分類算法進行訓練,獲取所述規范中文文本訓練樣本按序列正向在所述雙向長短時記憶神經網絡中的前向傳播輸出和后向傳播輸出,將所述規范中文文本訓練樣本按序列反向輸入到雙向長短時記憶神經網絡中,基于連續時間分類算法進行訓練,獲取所述規范中文文本訓練樣本按序列反向在所述雙向長短時記憶神經網絡中的前向傳播輸出和后向傳播輸出;前向傳播輸出表示為其中,t表示序列步數,u表示與t相對應的輸出的標簽值,表示輸出序列在第t步的輸出為l'u的概率,后向傳播輸出表示為其中,t表示序列步數,u表示與t相對應的輸出的標簽值,表示輸出序列在第t+1步的輸出為l'u的概率,
根據所述規范中文文本訓練樣本按序列正向在所述雙向長短時記憶神經網絡中的前向傳播輸出和后向傳播輸出獲取雙向長短時記憶神經網絡的正向誤差因子,根據所述規范中文文本訓練樣本按序列反向在所述雙向長短時記憶神經網絡中的前向傳播輸出和后向傳播輸出獲取雙向長短時記憶神經網絡的反向誤差因子,將雙向長短時記憶神經網絡的正向誤差因子和雙向長短時記憶神經網絡的反向誤差因子相加獲取雙向長短時記憶神經網絡的總誤差因子,根據雙向長短時記憶神經網絡的總誤差因子構建誤差函數;
根據所述誤差函數,采用粒子群算法更新雙向長短時記憶神經網絡的網絡參數,獲取規范中文文本識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810564059.1/1.html,轉載請聲明來源鉆瓜專利網。





