[發明專利]一種建模方法、識別方法、裝置、存儲介質及設備在審
| 申請號: | 201711459765.1 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108364036A | 公開(公告)日: | 2018-08-03 |
| 發明(設計)人: | 武晨 | 申請(專利權)人: | 順豐科技有限公司 |
| 主分類號: | G06K9/68 | 分類號: | G06K9/68;G06K9/62;G06N3/04 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 梁風霞 |
| 地址: | 518061 廣東省深圳市南山區學府路(以南)*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 建模 存儲介質 連接層 遞歸神經網絡 卷積神經網絡 路徑掃描 模型實現 人力資本 手寫文本 分類器 準確率 打字 樣本 優化 | ||
1.一種建立手寫運單文本識別模型的方法,其特征在于,包括:
將樣本進行路徑掃描、時間遞歸神經網絡處理、卷積神經網絡處理,生成全連接層數據;
所述全連接層數據經過CTC分類器、優化得到所述模型。
2.根據權利要求1所述的方法,其特征在于,所述路徑掃描為四方向路徑掃描。
3.根據權利要求1所述的方法,其特征在于,所述時間遞歸神經網絡處理、卷積神經網絡處理在執行過程中,包括:
將樣本集平均分為若干個樣本子集;
所述樣本子集中的每個樣本,重復路徑掃描、LSTM處理以及卷積求和處理若干次,生成全連接層數據。
4.根據權利要求1所述的方法,其特征在于,所述優化在執行過程中,包括:
將所述全連接層數據經過CTC分類器得到的數據與樣本的真實數據進行比較并迭代進行全網絡參數的優化,再利用訓練集、測試集和驗證集,采用梯度下降法優化,并基于GPU加速器迭代進行模型訓練。
5.一種建立手寫運單文本識別模型的裝置,其特征在于,包括:
數據生成單元,配置用于將樣本進行路徑掃描、時間遞歸神經網絡處理、卷積神經網絡處理,生成全連接層數據;
優化單元,配置用于所述全連接層數據經過CTC分類器、優化得到所述模型。
6.一種設備,其特征在于,所述設備包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行時,使得所述一個或多個處理器執行如權利要求1-4中任一項所述的方法。
7.一種存儲有計算機程序的計算機可讀存儲介質,其特征在于,該程序被處理器執行時實現如權利要求1-4中任一項所述的方法。
8.一種手寫運單文本識別方法,其特征在于,包括:
提取待識別手寫運單中的手寫文本區域,在所述手寫文本區域中提取出若干張信息圖片;
所述信息圖片通過手寫運單文本識別模型進行識別,所述模型利用權利要求1-4任一所述的方法建立。
9.一種手寫運單文本識別裝置,其特征在于,包括:
提取單元,配置用于提取待識別手寫運單中的手寫文本區域,在所述手寫文本區域中提取出若干張信息圖片;
識別單元,配置用于所述信息圖片通過手寫運單文本識別模型進行識別,所述模型利用權利要求1-4任一所述的方法建立。
10.一種設備,其特征在于,所述設備包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行時,使得所述一個或多個處理器執行如權利要求8所述的方法。
11.一種存儲有計算機程序的計算機可讀存儲介質,其特征在于,該程序被處理器執行時實現如權利要求8所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于順豐科技有限公司,未經順豐科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711459765.1/1.html,轉載請聲明來源鉆瓜專利網。





