[發(fā)明專利]訓練方法、文字識別方法、裝置、存儲介質(zhì)及電子設備有效
| 申請?zhí)枺?/td> | 202010440288.X | 申請日: | 2020-05-22 |
| 公開(公告)號: | CN111612157B | 公開(公告)日: | 2023-06-30 |
| 發(fā)明(設計)人: | 梁宇;許春陽;程芃森;陳航;張冬;崔凱銅;黃勇 | 申請(專利權)人: | 四川無聲信息技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06V30/148;G06N3/0464;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張磊 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 方法 文字 識別 裝置 存儲 介質(zhì) 電子設備 | ||
本申請?zhí)峁┮环N訓練方法、文字識別方法、裝置、存儲介質(zhì)及電子設備。通過多種顏色、多種文字大小、多種模糊層度以及多種文字傾斜角度的樣本圖像對機器學習模型進行訓練,使得訓練好的機器學習模型,能夠適應不同樣式的待識別圖像,進而提高了該機器學習模型對不同場景的適應能力。
技術領域
本申請涉及數(shù)據(jù)處理領域,具體而言,涉及一種訓練方法、文字識別方法、裝置、存儲介質(zhì)及電子設備。
背景技術
隨著OCR(Optical?Character?Recognition,光學字符識別)技術的不斷發(fā)展,其應用場景也變的日趨豐富(例如,身份證信息識別、圖片信息提取、財務信息提取以及車牌信息識別等)。然而,在實際應用中,識別效果容易受到待識別圖像的場景限制。即針對一些場景下的圖片,其識別效果較好;但針對另外一些場景下的圖片,則識別效果較為欠缺。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術中的至少一個不足,本申請實施例的目的之一在于提供一種訓練方法,應用于電子設備,所述電子設備配置有未訓練好的機器學習模型,所述方法包括:
獲取包含多種顏色、多種文字大小、多種模糊層度以及多種文字傾斜角度的樣本圖像,其中,每張樣本圖像包中,攜帶有特定語言種類的文字,且所述特定語言種類的文字的數(shù)量相同;
通過所述樣本圖像,訓練所述機器學習模型對所述樣本圖像中特定語言種類的文字進行識別,使得訓練好的機器學習模型能夠用于從所述樣本圖像識別出所述特定語言種類的文字。
可選地,所述樣本圖像爬取自多種的網(wǎng)絡平臺。
可選地,所述特定語言種類為粵語。
本申請實施例的目的之二在于提供一種文字識別方法,應用于電子設備,所述電子設備配置有經(jīng)上述訓練方法訓練好的機器學習模型以及字典文件,所述機器學習模型依次包括攜帶有殘差網(wǎng)絡的卷積層、遞歸網(wǎng)絡層以及轉(zhuǎn)錄層,所述方法包括:
獲取待識別圖像;
依次經(jīng)所述攜帶有殘差網(wǎng)絡的卷積層、所述遞歸網(wǎng)絡層以及所述轉(zhuǎn)錄層對所述待識別圖像中特定語言種類的文字進行識別,獲得各文字的文字編碼;
根據(jù)所述文字編碼索引所述字典文件,確定出與所述文字編碼對應的文字信息。
可選地,所述方法還包括:
通過全詞遮罩技術校驗所述文字信息,對所述文字信息中不符合所述文字信息語境的文字進行修正。
可選地,所述電子設備還配置有校驗模型,所述通過全詞遮罩技術校驗所述文字信息,對所述文字信息中不符合所述文字信息語境的文字進行修正的步驟,包括:
隱藏所述文字信息中的部分文字,獲得待校驗文字信息;
通過所述校驗模型根據(jù)所述待校驗文字信息的上下文對隱藏位置的文字進行預測,獲得預測文字;
將所述預測文字與所述隱藏位置的文字進行比較,對所述文字信息中不符合所述文字信息語境的文字進行修正。
本申請實施例的目的之三在于一種文字識別裝置,應用于電子設備,所述電子設備配置有經(jīng)訓練方法訓練好的機器學習模型以及字典文件,所述機器學習模型依次包括攜帶有殘差網(wǎng)絡的卷積層、遞歸網(wǎng)絡層以及轉(zhuǎn)錄層,所述文字識別裝置包括:
圖像獲取模塊,用于獲取待識別圖像;
編碼獲取模塊,用于依次經(jīng)所述攜帶有殘差網(wǎng)絡的卷積層、所述遞歸網(wǎng)絡層以及所述轉(zhuǎn)錄層對所述待識別圖像中特定語言種類的文字進行識別,獲得各文字的文字編碼;
文字索引模塊,用于根據(jù)所述文字編碼索引所述字典文件,確定出與所述文字編碼對應的文字信息。
可選地,所述文字識別裝置還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川無聲信息技術有限公司,未經(jīng)四川無聲信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010440288.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





