[發明專利]訓練方法、文字識別方法、裝置、存儲介質及電子設備有效
| 申請號: | 202010440288.X | 申請日: | 2020-05-22 |
| 公開(公告)號: | CN111612157B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 梁宇;許春陽;程芃森;陳航;張冬;崔凱銅;黃勇 | 申請(專利權)人: | 四川無聲信息技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06V30/148;G06N3/0464;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張磊 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 方法 文字 識別 裝置 存儲 介質 電子設備 | ||
1.一種文字識別方法,其特征在于,應用于電子設備,所述電子設備配置有校驗模型以及未訓練好的機器學習模型;
獲取包含多種顏色、多種文字大小、多種模糊層度以及多種文字傾斜角度的樣本圖像,其中,每張樣本圖像包中,攜帶有特定語言種類的文字,且所述特定語言種類的文字的數量相同;
通過所述樣本圖像,訓練所述機器學習模型對所述樣本圖像中特定語言種類的文字進行識別,獲得訓練好的機器學習模型以及字典文件,所述訓練好的機器學習模型依次包括攜帶有殘差網絡的卷積層、遞歸網絡層以及轉錄層,所述方法包括:
獲取待識別圖像;
依次經所述攜帶有殘差網絡的卷積層、所述遞歸網絡層以及所述轉錄層對所述待識別圖像中特定語言種類的文字進行識別,獲得各文字的文字編碼;
根據所述文字編碼索引所述字典文件,確定出與所述文字編碼對應的文字信息;
隱藏所述文字信息中的部分文字,獲得待校驗文字信息;
通過所述校驗模型根據所述待校驗文字信息的上下文對隱藏位置的文字進行預測,獲得預測文字;
將所述預測文字與所述隱藏位置的文字進行比較,對所述文字信息中不符合所述文字信息語境的文字進行修正。
2.一種文字識別裝置,其特征在于,應用于電子設備,所述電子設備配置有校驗模型以及未訓練好的機器學習模型;
所述電子設備獲取包含多種顏色、多種文字大小、多種模糊層度以及多種文字傾斜角度的樣本圖像,其中,每張樣本圖像包中,攜帶有特定語言種類的文字,且所述特定語言種類的文字的數量相同;
通過所述樣本圖像,訓練所述機器學習模型對所述樣本圖像中特定語言種類的文字進行識別,獲得訓練好的機器學習模型以及字典文件,所述訓練好的機器學習模型依次包括攜帶有殘差網絡的卷積層、遞歸網絡層以及轉錄層,所述文字識別裝置包括:
圖像獲取模塊,用于獲取待識別圖像;
編碼獲取模塊,用于依次經所述攜帶有殘差網絡的卷積層、所述遞歸網絡層以及所述轉錄層對所述待識別圖像中特定語言種類的文字進行識別,獲得各文字的文字編碼;
文字索引模塊,用于根據所述文字編碼索引所述字典文件,確定出與所述文字編碼對應的文字信息;
文字校驗模塊,用于隱藏所述文字信息中的部分文字,獲得待校驗文字信息;
通過所述校驗模型根據所述待校驗文字信息的上下文對隱藏位置的文字進行預測,獲得預測文字;
將所述預測文字與所述隱藏位置的文字進行比較,對所述文字信息中不符合所述文字信息語境的文字進行修正。
3.一種存儲介質,其特征在于,所述存儲介質存儲有計算機程序,所述計算機程序被處理器執行時,實現如權利要求1所述的文字識別方法。
4.一種電子設備,其特征在于,所述電子設備包括存儲器以及處理器,所述存儲器存儲有能夠被所述處理器執行的機器可執行指令,所述機器可執行指令被所述處理器執行時,實現如權利要求1所述的文字識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川無聲信息技術有限公司,未經四川無聲信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010440288.X/1.html,轉載請聲明來源鉆瓜專利網。





