[發明專利]漢字模型訓練方法、漢字識別方法、裝置、設備及介質在審
| 申請號: | 201810563512.7 | 申請日: | 2018-06-04 |
| 公開(公告)號: | CN108710866A | 公開(公告)日: | 2018-10-26 |
| 發明(設計)人: | 吳啟;周罡 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 胡志桐 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手寫 模型訓練 訓練樣本 字體圖像 準確率 循環神經網絡 漢字識別 漢字 測試集 訓練集 卷積 預設 二級字庫 反向傳播 分配規則 時間分類 算法更新 權值和 字圖像 偏置 算法 標注 中文 | ||
1.一種漢字模型訓練方法,其特征在于,包括:
初始化卷積循環神經網絡模型的權值和偏置;
獲取字體圖像訓練樣本,采用中文二級字庫對所述字體圖像訓練樣本中的手寫字圖像進行標注,并按預設分配規則將所述字體圖像訓練樣本分為訓練集和測試集;
將所述訓練集輸入到卷積循環神經網絡模型中,獲取卷積循環神經網絡模型的前向輸出和后向輸出,根據所述卷積循環神經網絡模型的前向輸出和后向輸出,采用基于連續時間分類算法的反向傳播算法更新所述卷積循環神經網絡模型中的權值和偏置,獲取初始手寫字識別模型;
將所述測試集輸入到所述初始手寫字識別模型中,獲取識別準確率,若所述識別準確率大于預設準確率,則確定所述初始手寫字識別模型為目標手寫字識別模型。
2.如權利要求1所述的漢字模型訓練方法,其特征在于,所述卷積循環神經網絡模型包括卷積神經網絡模型及循環神經網絡模型;
所述將所述訓練集輸入到卷積循環神經網絡模型中,獲取卷積循環神經網絡模型的前向輸出和后向輸出,根據所述卷積循環神經網絡模型的前向輸出和后向輸出,采用基于連續時間分類算法的反向傳播算法更新所述卷積循環神經網絡模型中的權值和偏置,獲取初始手寫字識別模型,包括:
將訓練集中手寫字圖像輸入到卷積神經網絡模型中,獲取訓練集中手寫字圖像對應的手寫字圖像特征;
將所述訓練集中手寫字圖像對應的手寫字圖像特征輸入到循環神經網絡模型中進行訓練,獲取所述循環神經網絡模型的前向輸出和后向輸出,所述循環神經網絡模型的前向輸出的公式為其中,a(t,u)表示第t時刻第u個所述手寫字圖像特征對應的前向輸出,表示t時刻輸出為空格的概率,l'u表示手寫字圖像和空格的總長度,a(t-1,i)表示t-1時刻第i個漢字的前向輸出;所述循環神經網絡模型的后向輸出的公式為其中,b(t,u)表示第t時刻第u個所述手寫字圖像特征對應的后向輸出表示t+1時刻輸出為空格的概率,a(t+1,i)表示t+1時刻第i個漢字的后向輸出;
根據所述循環神經網絡模型的前向輸出和后向輸出,構建損失函數,并根據所述損失函數,采用基于連續時間分類算法的反向傳播算法更新調整所述循環神經網絡模型和所述卷積神經網絡模型中的權值和偏置,獲取初始手寫字識別模型,所述損失函數的具體表達式為:其中,x表示輸入的漢字,z表示輸入的漢字x對應的輸出,u表示第u個漢字,z'表示漢字的長度,a(t,u)表示第t時刻第u個漢字對應的前向輸出,b(t,u)表示第t時刻第u個漢字對應的后向輸出。
3.一種漢字識別方法,其特征在于,包括:
獲取原始圖像,所述原始圖像包括手寫字和背景圖像;
對所述原始圖像進行預處理,獲取有效圖像;
采用核密度估計算法和腐蝕方法對所述有效圖像進行處理,去除背景圖像,獲取包括所述手寫字的目標圖像;
采用文字定位技術對所述目標圖像進行文字定位,獲取文本行圖像;
將所述文本行圖像輸入到目標手寫字識別模型中進行識別,獲取所述文本行圖像對應的識別結果,所述目標手寫字識別模型是采用權利要求1或2所述漢字模型訓練方法獲取到的。
4.如權利要求3所述的漢字識別方法,其特征在于,所述對所述原始圖像進行預處理,獲取有效圖像,包括:
對所述原始圖像進行放大和灰度化處理,獲取灰度圖像;
對所述灰度圖像對應的像素矩陣進行極差標準化處理,獲取有效圖像,其中,所述極差標準化處理的公式為x是標準化前有效圖像的像素,x'是標準化后有效圖像的像素,Mmin是所述灰度圖像對應的像素矩陣M中最小的像素,Mmax是所述灰度圖像對應的像素矩陣M中最大的像素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810563512.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于神經網絡的司機異常行為檢測方法
- 下一篇:車位導航方法及相關產品





