[發(fā)明專利]一種手寫識別方法、裝置、電子設備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202011638602.1 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN114764914A | 公開(公告)日: | 2022-07-19 |
| 發(fā)明(設計)人: | 辛曉哲;秦波;趙志勇;王英俊;王杰;蘇雪峰;陳偉 | 申請(專利權)人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號: | G06V30/22 | 分類號: | G06V30/22;G06V30/20;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京華沛德權律師事務所 11302 | 代理人: | 房德權 |
| 地址: | 100084 北京市海淀區(qū)中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 手寫 識別 方法 裝置 電子設備 介質(zhì) | ||
本發(fā)明實施例公開了一種手寫識別方法,獲取手寫輸入軌跡數(shù)據(jù);獲取所述手寫輸入軌跡數(shù)據(jù)的手寫原始軌跡數(shù)據(jù);將所述手寫軌跡數(shù)據(jù)輸入到預設的端到端手寫識別模型中進行識別,得到所述手寫輸入軌跡數(shù)據(jù)對應的文字識別結果,其中,所述端到端手寫識別模型是利用訓練數(shù)據(jù)集中每個訓練數(shù)據(jù)的手寫軌跡數(shù)據(jù)訓練得到的。本發(fā)明實施例提供的手寫識別方法,能夠解決現(xiàn)有技術中非正確切分導致手寫識別準確率低的問題,能夠有效提高致手寫識別準確率。
技術領域
本發(fā)明實施例涉及互聯(lián)網(wǎng)技術領域,尤其涉及一種手寫識別方法、裝置、電子設備及介質(zhì)。
背景技術
隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,為了方便用戶輸入,通常會提供多種輸入方式例如包括語音輸入、手寫輸入和拼音輸入等方式,當用戶使用手寫輸入時,會通過手寫識別模型對手寫輸入的數(shù)據(jù)進行識別,提高識別效率,使得用戶的體驗更好。
但是,現(xiàn)有技術中在手寫數(shù)據(jù)進行識別的手寫識別框架通常是基于切分、組合再識別的三階段架構,在使用手寫識別框架進行識別時,尤其是在針對連筆輸入例如連筆草書和連筆行書等連筆手寫進行識別時,由于連筆手寫中間沒有斷筆,切分模塊針對連筆手寫進行切分時存在非正確切分的概率非常高,進而會導致識別的準確率較低。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種手寫識別方法、裝置、電子設備及介質(zhì),能夠解決現(xiàn)有技術中非正確切分導致手寫識別準確率低的問題,能夠有效提高致手寫識別準確率。
本發(fā)明實施例第一方面提供了一種手寫識別方法,包括:
獲取手寫輸入軌跡數(shù)據(jù);
獲取所述手寫輸入軌跡數(shù)據(jù)的手寫原始軌跡數(shù)據(jù);
將所述手寫軌跡數(shù)據(jù)輸入到預設的端到端手寫識別模型中進行識別,得到所述手寫輸入軌跡數(shù)據(jù)對應的文字識別結果,其中,所述端到端手寫識別模型是利用訓練數(shù)據(jù)集中每個訓練數(shù)據(jù)的手寫軌跡數(shù)據(jù)訓練得到的。
可選的,所述獲取所述手寫輸入軌跡數(shù)據(jù)的手寫原始軌跡數(shù)據(jù),包括:
對所述手寫輸入軌跡數(shù)據(jù)進行數(shù)據(jù)預處理,其中,所述數(shù)據(jù)預處理包括重采樣、歸一化、拉伸和軌跡旋轉中的至少一種;
根據(jù)預處理后的所述手寫輸入軌跡數(shù)據(jù),獲取所述手寫原始軌跡數(shù)據(jù)。
可選的,所述端到端手寫識別模型的訓練步驟,包括:
獲取訓練數(shù)據(jù)集及與所述訓練數(shù)據(jù)集對應的預選訓練模型;
獲取所述訓練數(shù)據(jù)集中每個訓練數(shù)據(jù)的手寫軌跡數(shù)據(jù);
利用每個訓練數(shù)據(jù)的手寫軌跡數(shù)據(jù),對所述預選訓練模型進行訓練,得到訓練好的所述預選訓練模型作為所述端到端手寫識別模型。
可選的,所述獲取訓練數(shù)據(jù)集,包括:
獲取歷史手寫軌跡數(shù)據(jù)集,其中,所述歷史手寫軌跡數(shù)據(jù)集包括水平手寫的軌跡數(shù)據(jù)、豎直手寫的軌跡數(shù)據(jù)、疊寫的軌跡數(shù)據(jù)和旋轉手寫的軌跡數(shù)據(jù)中的一種或多種;
對所述歷史手寫軌跡數(shù)據(jù)集中的手寫數(shù)據(jù)進行數(shù)據(jù)增強,將數(shù)據(jù)增強后的所述歷史手寫軌跡數(shù)據(jù)集作為訓練數(shù)據(jù)集。
可選的,所述利用每個訓練數(shù)據(jù)的手寫軌跡數(shù)據(jù),對所述預選訓練模型進行訓練,得到所述端到端手寫識別模型,包括:
獲取每個訓練數(shù)據(jù)中的困難樣本和簡單樣本;
采用先訓練困難樣本后訓練簡單樣本的方式,對所述預選模型進行訓練;
在對所述預選模型進行訓練過程中,對所述預選訓練模型進行微調(diào),得到訓練好的所述預選訓練模型作為所述端到端手寫識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011638602.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





