[發(fā)明專利]書寫文字識別方法、裝置、終端設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202111016714.8 | 申請日: | 2021-08-31 |
| 公開(公告)號: | CN113657347A | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計)人: | 黃光偉;王紅 | 申請(專利權(quán))人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 邵泳城 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 書寫 文字 識別 方法 裝置 終端設(shè)備 存儲 介質(zhì) | ||
1.一種書寫文字識別方法,其特征在于,包括:
獲取書寫軌跡數(shù)據(jù),所述書寫軌跡數(shù)據(jù)包括軌跡點坐標(biāo)和對應(yīng)的書寫時間信息;
在所述書寫軌跡數(shù)據(jù)不屬于新文件的情況下,根據(jù)所述軌跡點坐標(biāo)和所述書寫時間信息進行文本行分割得到文本行;
根據(jù)所述軌跡點坐標(biāo)將所述文本行的所述書寫軌跡數(shù)據(jù)和對應(yīng)的歷史書寫軌跡數(shù)據(jù)合并得到合并軌跡數(shù)據(jù);
保存分行后的所述合并軌跡數(shù)據(jù);和
利用文本識別模型對分別對每行所述合并軌跡數(shù)據(jù)進行識別得到識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的書寫文字識別方法,其特征在于,所述書寫文字識別方法還包括:
在所述書寫軌跡數(shù)據(jù)屬于新文件的情況下,根據(jù)所述軌跡點坐標(biāo)和所述書寫時間信息進行文本行分割得到新文本行;
保存分行后所述文本行的所述書寫軌跡數(shù)據(jù);
利用所述文本識別模型對分別對每行所述書寫軌跡數(shù)據(jù)進行識別得到識別結(jié)果。
3.根據(jù)權(quán)利要求1所述的書寫文字識別方法,其特征在于,所述根據(jù)所述軌跡點坐標(biāo)和所述書寫時間信息進行文本行分割得到文本行,包括:
根據(jù)所述書寫軌跡數(shù)據(jù)的落筆狀態(tài)和抬筆狀態(tài)劃分書寫筆劃;
根據(jù)所述書寫時間信息確定各個所述書寫筆劃之間的書寫間隔時間;
根據(jù)所述書寫間隔時間對所述書寫筆劃進行分塊得到第一文本塊;
根據(jù)第一距離閾值對所述第一文本塊進行分塊得到第二文本塊,所述第一距離閾值根據(jù)所述第一文本塊確定;
根據(jù)第二距離閾值對所述第二文本塊進行分塊得到第三文本塊,所述第二距離閾值根據(jù)所述第二文本塊確定;
根據(jù)所述軌跡點坐標(biāo)在字體高度方向上的重疊率合并所述第三文本塊得到所述文本行。
4.根據(jù)權(quán)利要求3所述的書寫文字識別方法,其特征在于,所述根據(jù)所述軌跡點坐標(biāo)將所述文本行的所述書寫軌跡數(shù)據(jù)和對應(yīng)的歷史書寫軌跡數(shù)據(jù)合并得到合并軌跡數(shù)據(jù),包括:
根據(jù)橡皮軌跡刪除對應(yīng)的歷史書寫軌跡數(shù)據(jù)后進行文本行分塊得到歷史書寫文本塊;
根據(jù)每行的中心點坐標(biāo)和文本塊順序合并所述歷史文本塊和所述文本行得到所述合并軌跡數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的書寫文字識別方法,其特征在于,所述獲取書寫軌跡數(shù)據(jù)包括:
接收用戶在終端調(diào)用手寫識別服務(wù)上傳的手寫文件以獲取所述書寫軌跡數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的書寫文字識別方法,其特征在于,所述書寫文字識別方法包括:
將所述識別結(jié)果返回至所述終端。
7.根據(jù)權(quán)利要求1所述的書寫文字識別方法,其特征在于,所述書寫文字識別方法還包括:
建立深度學(xué)習(xí)模型;
獲取訓(xùn)練軌跡數(shù)據(jù),所述訓(xùn)練軌跡數(shù)據(jù)為用戶輸入每行文本對應(yīng)的所述書寫軌跡數(shù)據(jù);
利用所述訓(xùn)練軌跡數(shù)據(jù)對所述深度學(xué)習(xí)模型進行訓(xùn)練,得到所述文本識別模型。
8.根據(jù)權(quán)利要求7所述的書寫文字識別方法,其特征在于,所述建立深度學(xué)習(xí)模型包括:
基于時間遞歸神經(jīng)網(wǎng)絡(luò)建立所述深度學(xué)習(xí)模型,所述深度學(xué)習(xí)模型包括多層長短期記憶神經(jīng)網(wǎng)絡(luò)。
9.一種書寫文字識別裝置,其特征在于,包括:
獲取模塊,用于獲取書寫軌跡數(shù)據(jù),所述書寫軌跡數(shù)據(jù)包括軌跡點坐標(biāo)和對應(yīng)的書寫時間信息;
分割模塊,用于在所述書寫軌跡數(shù)據(jù)不屬于新文件的情況下,根據(jù)所述軌跡點坐標(biāo)和所述書寫時間信息進行文本行分割得到文本行;
合并模塊,用于根據(jù)所述軌跡點坐標(biāo)將所述文本行的所述書寫軌跡數(shù)據(jù)和對應(yīng)的歷史書寫軌跡數(shù)據(jù)合并得到合并軌跡數(shù)據(jù);
保存模塊,用于保存分行后的所述合并軌跡數(shù)據(jù);
識別模塊,用于利用文本識別模型對分別對每行所述合并軌跡數(shù)據(jù)進行識別得到識別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于京東方科技集團股份有限公司,未經(jīng)京東方科技集團股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111016714.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種進氣道模具及其制作方法
- 下一篇:一種電源濾波器的絕緣安裝組件
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





