[發明專利]書寫文字識別方法、裝置、終端設備和存儲介質在審
| 申請號: | 202111016714.8 | 申請日: | 2021-08-31 |
| 公開(公告)號: | CN113657347A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 黃光偉;王紅 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 邵泳城 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 書寫 文字 識別 方法 裝置 終端設備 存儲 介質 | ||
本申請公開了一種書寫文字識別方法、書寫文字識別裝置、終端設備和可讀存儲介質。書寫文字識別方法包括:獲取書寫軌跡數據,書寫軌跡數據包括軌跡點坐標和對應的書寫時間信息,并在書寫軌跡數據不屬于新文件的情況下,根據軌跡點坐標和書寫時間信息進行文本行分割得到文本行,進而根據軌跡點坐標將文本行的書寫軌跡數據和對應的歷史書寫軌跡數據合并得到合并軌跡數據,再保存分行后的合并軌跡數據,最后利用文本識別模型對分別對每行合并軌跡數據進行識別得到識別結果。本申請通過在判斷出書寫軌跡數據為非新文件情況下分割成多行文本,從而對每行文本進行識別,如此,可以完成對整篇書寫軌跡數據的識別,提升了用戶體驗。
技術領域
本申請涉及圖像識別技術,特別涉及一種書寫文字識別方法、書寫文字識別裝置、終端設備和存儲介質。
背景技術
用戶在使用會議一體機時,可以在其對應的應用程序中通過手寫的方式記錄會議內容、紀要或培訓等內容,這些書寫內容可以以文件的形式被保存在本地的存儲器上,從而便于用戶后續查閱。當文件過多時,用戶難以找到想要的文件,相關技術中,可通過書寫文字識別技術實現快速定位到想要的文件。然而,目前的書寫文字識別技術只能對單個字或單行內容進行識別,識別效果有限。
發明內容
本申請提供了一種書寫文字識別方法,用于書寫文字識別裝置,所述書寫文字識別方法包括:
獲取書寫軌跡數據,所述書寫軌跡數據包括軌跡點坐標和對應的書寫時間信息;
在所述書寫軌跡數據不屬于新文件的情況下,根據所述軌跡點坐標和所述書寫時間信息進行文本行分割得到文本行;
根據所述軌跡點坐標將所述文本行的所述書寫軌跡數據和對應的歷史書寫軌跡數據合并得到合并軌跡數據;
保存分行后的所述合并軌跡數據;和
利用文本識別模型對分別對每行所述合并軌跡數據進行識別得到識別結果。
在某些實施方式中,所述書寫文字識別方法還包括:
在所述書寫軌跡數據屬于新文件的情況下,根據所述軌跡點坐標和所述書寫時間信息進行文本行分割得到新文本行;
保存分行后所述文本行的所述書寫軌跡數據;
利用所述文本識別模型對分別對每行所述書寫軌跡數據進行識別得到識別結果。
在某些實施方式中,所述根據所述軌跡點坐標和所述書寫時間信息進行文本行分割得到文本行,包括:
根據所述書寫軌跡數據的落筆狀態和抬筆狀態劃分書寫筆劃;
根據所述書寫時間信息確定各個所述書寫筆劃之間的書寫間隔時間;
根據所述書寫間隔時間對所述書寫筆劃進行分塊得到第一文本塊;
根據第一距離閾值對所述第一文本塊進行分塊得到第二文本塊,所述第一距離閾值根據所述第一文本塊確定;
根據第二距離閾值對所述第二文本塊進行分塊得到第三文本塊,所述第二距離閾值根據所述第二文本塊確定;
根據所述軌跡點坐標在字體高度方向上的重疊率合并所述第三文本塊得到所述文本行。
在某些實施方式中,所述根據所述軌跡點坐標將所述文本行的所述書寫軌跡數據和對應的歷史書寫軌跡數據合并得到合并軌跡數據,包括:
根據橡皮軌跡刪除對應的歷史書寫軌跡數據后進行文本行分塊得到歷史書寫文本塊;
根據每行的中心點坐標和文本塊順序合并所述歷史文本塊和所述文本行得到所述合并軌跡數據。
在某些實施方式中,所述獲取書寫軌跡數據包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111016714.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種進氣道模具及其制作方法
- 下一篇:一種電源濾波器的絕緣安裝組件





