[發明專利]手寫文本識別方法及計算機存儲介質有效
| 申請號: | 202110263677.4 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN112686219B | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 姜明;劉霄;熊澤法 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/48;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京合智同創知識產權代理有限公司 11545 | 代理人: | 李杰 |
| 地址: | 100086 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手寫 文本 識別 方法 計算機 存儲 介質 | ||
1.一種手寫文本識別方法,其特征在于,所述方法包括:
通過第一手寫文本識別模型中基于特征金字塔網絡的編碼器,對待識別的手寫文本圖像的圖像輪廓特征進行編碼,以獲得所述手寫文本圖像的多個不同尺度的圖像輪廓特征數據,并對所述多個不同尺度的圖像輪廓特征數據進行多尺度特征融合,以獲得所述手寫文本圖像的圖像輪廓特征融合數據,其中,所述特征金字塔網絡為用于特征融合的神經網絡;
通過所述第一手寫文本識別模型中的殘差解碼器,對所述手寫文本圖像的圖像輪廓特征融合數據進行殘差解碼,以獲得所述手寫文本圖像中的手寫文字的字符后驗概率分布數據,其中,所述殘差解碼器為利用殘差數據進行解碼的解碼器;
通過所述第一手寫文本識別模型中的連接時序分類層,基于所述手寫文本圖像中的手寫文字的字符后驗概率分布數據,識別出所述手寫文本圖像的手寫文字識別結果。
2.根據權利要求1所述的手寫文本的識別方法,其特征在于,所述通過第一手寫文本識別模型中基于特征金字塔網絡的編碼器,對待識別的手寫文本圖像的圖像輪廓特征進行編碼之前,所述方法還包括:
對所述待識別的手寫文本圖像進行尺寸規范化,以獲得尺寸規范化后的手寫文本圖像;
所述通過第一手寫文本識別模型中基于特征金字塔網絡的編碼器,對待識別的手寫文本圖像的圖像輪廓特征進行編碼,包括:
通過所述編碼器,對所述尺寸規范化后的手寫文本圖像的圖像輪廓特征進行編碼,以獲得所述尺寸規范化后的手寫文本圖像的多個不同尺度的圖像輪廓特征數據。
3.根據權利要求2所述的手寫文本的識別方法,其特征在于,所述對所述待識別的手寫文本圖像進行尺寸規范化之后,所述方法還包括:
對所述尺寸規范化后的手寫文本圖像進行圖像掩膜預處理,以獲得預處理后的手寫文本圖像;
所述通過第一手寫文本識別模型中基于特征金字塔網絡的編碼器,對待識別的手寫文本圖像的圖像輪廓特征進行編碼,包括:
通過所述編碼器,對所述預處理后的手寫文本圖像的圖像輪廓特征進行編碼,以獲得所述預處理后的手寫文本圖像的多個不同尺度的圖像輪廓特征數據。
4.根據權利要求1所述的手寫文本的識別方法,其特征在于,所述對待識別的手寫文本圖像的圖像輪廓特征進行編碼,以獲得所述手寫文本圖像的多個不同尺度的圖像輪廓特征數據,包括:
通過所述編碼器的多個卷積層,對所述待識別的手寫文本圖像進行圖像輪廓特征提取,以獲得所述手寫文本圖像的多個不同尺度的第一圖像輪廓特征圖;
通過所述編碼器的多個最大池化層,對所述手寫文本圖像的多個不同尺度的第一圖像輪廓特征圖進行圖像輪廓特征壓縮,以獲得所述手寫文本圖像的多個不同尺度的第二圖像輪廓特征圖,其中,所述多個最大池化層的輸入端分別與所述多個卷積層的輸出端連接,并且所述多個卷積層與所述多個最大池化層串行連接;
確定所述手寫文本圖像的多個不同尺度的第二圖像輪廓特征圖為所述手寫文本圖像的多個不同尺度的圖像輪廓特征數據。
5.根據權利要求4所述的手寫文本的識別方法,其特征在于,所述對所述多個不同尺度的圖像輪廓特征數據進行多尺度特征融合,以獲得所述手寫文本圖像的圖像輪廓特征融合數據,包括:
通過所述編碼器的特征金字塔網絡,對所述手寫文本圖像的多個不同尺度的第二圖像輪廓特征圖進行多尺度特征融合,以獲得所述手寫文本圖像的圖像輪廓特征融合的第一特征圖;
確定所述手寫文本圖像的圖像輪廓特征融合的第一特征圖為所述手寫文本圖像的圖像輪廓特征融合數據。
6.根據權利要求5所述的手寫文本的識別方法,其特征在于,所述特征金字塔網絡包括雙向特征金字塔網絡,
所述通過所述編碼器的特征金字塔網絡,對所述手寫文本圖像的多個不同尺度的第二圖像輪廓特征圖進行多尺度特征融合,包括:
通過所述雙向特征金字塔網絡的第一網絡層,對所述多個不同尺度的第二圖像輪廓特征圖進行自上而下的特征融合,以獲得所述手寫文本圖像的圖像輪廓特征融合的多個不同尺度的第二特征圖;
通過所述雙向特征金字塔網絡的第二網絡層,對所述多個不同尺度的第二特征圖進行自下而上的特征融合,以獲得所述第一特征圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110263677.4/1.html,轉載請聲明來源鉆瓜專利網。





