[發(fā)明專利]一種建模方法、識別方法、裝置、存儲介質及設備在審
| 申請?zhí)枺?/td> | 201711459765.1 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN108364036A | 公開(公告)日: | 2018-08-03 |
| 發(fā)明(設計)人: | 武晨 | 申請(專利權)人: | 順豐科技有限公司 |
| 主分類號: | G06K9/68 | 分類號: | G06K9/68;G06K9/62;G06N3/04 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 梁風霞 |
| 地址: | 518061 廣東省深圳市南山區(qū)學府路(以南)*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 建模 存儲介質 連接層 遞歸神經網(wǎng)絡 卷積神經網(wǎng)絡 路徑掃描 模型實現(xiàn) 人力資本 手寫文本 分類器 準確率 打字 樣本 優(yōu)化 | ||
本發(fā)明公開了一種建模方法、識別方法、裝置、存儲介質及設備,所述建模方法包括:將樣本進行路徑掃描、時間遞歸神經網(wǎng)絡處理、卷積神經網(wǎng)絡處理,生成全連接層數(shù)據(jù);所述全連接層數(shù)據(jù)經過CTC分類器、優(yōu)化得到所述模型。所述識別用法用所述建模方法所建的模型實現(xiàn),所述存儲介質及設備分別用于實現(xiàn)所述方法。本發(fā)明技術能代替人工打字錄單的過程,縮減了大量的人力資本,大幅度提高了錄單的準確率,技術方案不僅可以識別運單上的手寫文本。
技術領域
本發(fā)明涉及手寫漢字識別技術領域,尤其涉及一種建模方法、識別方法、裝置、存儲介質及設備。
背景技術
當前人工智能領域已經可以實現(xiàn)對單一手寫漢字的較準確的識別,所以通過手寫的地址文本切分成單個漢字并依次進行識別本可以實現(xiàn)完整地址的識別,但是,目前“切割漢字的技術”還沒有發(fā)展到可以保證正確率的程度,進而導致識別結果正確率很低。
另外,快遞在被運送路上之前,每一件快遞都要經歷錄單的過程,目的是將運單上的二維碼與寄件人手寫的地址信息的對應關系保存在電腦里,進而之后的收發(fā)結點僅僅通過掃描二維碼來獲取該快件的目標地址。而且,目前我們的錄單過程都是依靠人工手動敲打鍵盤來把運單上的手寫地址錄入電腦系統(tǒng)里,這樣不僅消耗大量的人力成本,還無法保證錄單的正確率。一旦錄入的地址錯誤,對應的快遞就會毫無懸念的被寄往錯誤的地點。
終上所述,現(xiàn)有技術存在的問題是:“切割漢字的技術”還沒有發(fā)展到可以保證正確率的程度,進而導致識別結果正確率很低,并且在快遞行業(yè),人工打字錄單的過程會消耗大量的人力成本,而且枯燥重復的工作,會讓人工識別地址經常出錯,并且由于手寫地址是一串沒有間隔的漢字,同時漢字往往是左右或者上下結構的,所以將地址切分成一個一個的漢字是事倍功半的過程。
發(fā)明內容
為了解決上述現(xiàn)有技術中的不足,本發(fā)明的目的在于提供一種建模方法、識別方法、裝置、存儲介質及設備。它提高了手寫運單的識別精確度,提高了識別效率。
為了實現(xiàn)上述目的,本發(fā)明所采用的技術方案為:
一種建立手寫運單文本識別模型的方法,包括:
將樣本進行路徑掃描、時間遞歸神經網(wǎng)絡處理、卷積神經網(wǎng)絡處理,生成全連接層數(shù)據(jù);
所述全連接層數(shù)據(jù)經過CTC分類器、優(yōu)化得到所述模型。
所述路徑掃描為四方向路徑掃描。
所述時間遞歸神經網(wǎng)絡處理、卷積神經網(wǎng)絡處理在執(zhí)行過程中,包括:
將樣本集平均分為若干個樣本子集;
所述樣本子集中的每個樣本,重復路徑掃描、LSTM處理以及卷積求和處理若干次,生成全連接層數(shù)據(jù)。
所述優(yōu)化在執(zhí)行過程中,包括:
將所述全連接層數(shù)據(jù)經過CTC分類器得到的數(shù)據(jù)與樣本的真實數(shù)據(jù)進行比較并迭代進行全網(wǎng)絡參數(shù)的優(yōu)化,再利用訓練集、測試集和驗證集,采用梯度下降法優(yōu)化,并基于GPU加速器迭代進行模型訓練。
一種建立手寫運單文本識別模型的裝置,包括:
數(shù)據(jù)生成單元,配置用于將樣本進行路徑掃描、時間遞歸神經網(wǎng)絡處理、卷積神經網(wǎng)絡處理,生成全連接層數(shù)據(jù);
優(yōu)化單元,配置用于所述全連接層數(shù)據(jù)經過CTC分類器、優(yōu)化得到所述模型。
一種設備,所述設備包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行所述的建立手寫運單文本識別模型的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于順豐科技有限公司,未經順豐科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711459765.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





