[發明專利]手寫識別方法及裝置在審
| 申請號: | 201810975834.2 | 申請日: | 2018-08-24 |
| 公開(公告)號: | CN110858317A | 公開(公告)日: | 2020-03-03 |
| 發明(設計)人: | 辛曉哲 | 申請(專利權)人: | 北京搜狗科技發展有限公司;搜狗(杭州)智能科技有限公司 |
| 主分類號: | G06K9/68 | 分類號: | G06K9/68 |
| 代理公司: | 北京華圣典睿知識產權代理有限公司 11510 | 代理人: | 趙景平 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手寫 識別 方法 裝置 | ||
1.一種手寫識別方法,其特征在于,所述方法包括:
獲取字符筆跡;
獲取對應所述字符筆跡所屬語言類別的切分模型;
利用所述切分模型對所述字符筆跡進行切分,得到切分塊序列;
對所述切分塊序列進行識別,得到所述字符筆跡對應的字符串。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:在對所述切分塊序列進行識別之前,判斷所述字符筆跡對應的語言類別是否為易產生過切分的語言;如果是,則對所述切分塊序列中的切分塊進行組合處理;否則執行對所述切分塊序列進行識別的步驟。
3.根據權利要求2所述的方法,其特征在于,所述對所述切分塊序列中的切分塊進行組合處理包括:
提取各切分塊的幾何特征;
利用預先構建的多元幾何模型及相鄰切分塊的幾何特征判斷所述相鄰切分塊是否屬于同一個字符;
如果是,則將所述相鄰切分塊合并。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:通過以下方式預先構建所述多元幾何模型:
采集大量切分塊數據作為訓練樣本,并對屬于同一字符的切分塊進行標注;
提取所述訓練樣本的幾何特征,所述幾何特征包括以下任意一種或多種:各切分塊的長度、寬度、位置;相鄰切分塊的距離、位置關系;各切分塊的長度與平均長度的差值,各切分塊的寬度與平均寬度的差值;
利用所述幾何特征及標注信息訓練得到所述多元幾何模型。
5.根據權利要求1至4任一項所述的方法,其特征在于,所述對所述切分塊序列進行識別,得到所述字符筆跡對應的字符串包括:
對所述切分塊序列中的切分塊進行識別,得到所述切分塊對應的各字符;
確定各候選路徑;
計算各候選路徑的得分;
選擇最優候選路徑;
根據所述最優候選路徑上的各字符得到所述字符筆跡對應的字符串。
6.根據權利要求5所述的方法,其特征在于,所述計算各候選路徑的得分包括:
計算所述候選路徑上各字符的得分,并將所述候選路徑上各字符的得分相加得到得分總和;
將所述得分總和除以所述候選路徑的長度,得到所述候選路徑的得分。
7.根據權利要求6所述的方法,其特征在于,所述計算所述候選路徑上各字符的得分包括:
根據以下任意一項或多項計算所述候選路徑上各字符的得分:所述字符的分類器得分、語言模型得分、詞庫得分。
8.一種手寫識別裝置,其特征在于,所述裝置包括:
接收模塊,用于獲取字符筆跡;
切分模型獲取模塊,用于獲取所述字符筆跡所屬語言類別的切分模型;
切分模塊,用于利用所述切分模型對所述字符串筆跡進行切分,得到切分塊序列;
識別模塊,用于對所述切分模塊得到的切分塊序列進行識別,得到所述字符筆跡對應的字符串。
9.一種計算機設備,其特征在于,包括:一個或多個處理器、存儲器;
所述存儲器用于存儲計算機可執行指令,所述處理器用于執行所述計算機可執行指令,以實現如權利要求1至7任一項所述的方法。
10.一種可讀存儲介質,其上存儲有指令,所述指令被執行以實現如權利要求1至7任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司;搜狗(杭州)智能科技有限公司,未經北京搜狗科技發展有限公司;搜狗(杭州)智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810975834.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:集液箱
- 下一篇:衣物處理設備及其底座組件





