[發(fā)明專利]一種文本識別方法、裝置、設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202210541217.8 | 申請日: | 2022-05-19 |
| 公開(公告)號: | CN114973247A | 公開(公告)日: | 2022-08-30 |
| 發(fā)明(設(shè)計)人: | 胡飛;李云良;王智浩 | 申請(專利權(quán))人: | 北京世紀(jì)好未來教育科技有限公司 |
| 主分類號: | G06V30/10 | 分類號: | G06V30/10;G06V30/148;G06V30/19;G06V10/80;G06V10/764;G06V10/82;G06F40/30;G06K9/62;G06N3/08 |
| 代理公司: | 北京開陽星知識產(chǎn)權(quán)代理有限公司 11710 | 代理人: | 付宏艷 |
| 地址: | 100089 北京市海淀區(qū)中*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 識別 方法 裝置 設(shè)備 介質(zhì) | ||
本公開涉及一種文本識別方法、裝置、設(shè)備及介質(zhì),該方法包括:獲取包含目標(biāo)語句的待處理圖像;目標(biāo)語句由多個初始字符組成;基于待處理圖像,獲取一組字符圖像以及與目標(biāo)語句對應(yīng)的生成語句;其中,每張字符圖像包括一個初始字符;對各字符圖像進(jìn)行特征提取,得到各初始字符對應(yīng)的圖像特征;對生成語句進(jìn)行特征提取,得到生成語句中各字符對應(yīng)的文本特征;基于圖像特征和文本特征,得到目標(biāo)語句的文本識別結(jié)果。本公開能夠提高文本識別結(jié)果的準(zhǔn)確性。
技術(shù)領(lǐng)域
本公開涉及文本識別技術(shù)領(lǐng)域,尤其涉及一種文本識別方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù)
目前,采用機(jī)器學(xué)習(xí)方法或OCR識別等常見的文本識別方法,取得的文本識別結(jié)果準(zhǔn)確性并不高,經(jīng)常出現(xiàn)錯誤識別字符的情況。同時,文本糾錯主要是以自然語言處理技術(shù)為基礎(chǔ),再結(jié)合易錯詞表對文本進(jìn)行糾錯。該方式需要較高的人力成本構(gòu)建易錯詞表,且易錯詞表無法窮舉全部的易錯詞,對于未出現(xiàn)過錯誤文本無法進(jìn)行糾正。因此,目前的文本識別方法的糾錯能力不足,影響文本識別結(jié)果的準(zhǔn)確性。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題或者至少部分地解決上述技術(shù)問題,本公開提供了一種文本識別方法、裝置、設(shè)備及介質(zhì)。
根據(jù)本公開的一方面,提供了一種文本識別方法,包括:
獲取包含目標(biāo)語句的待處理圖像;所述目標(biāo)語句由多個初始字符組成;
基于所述待處理圖像,獲取一組字符圖像以及與所述目標(biāo)語句對應(yīng)的生成語句;其中,每張字符圖像包括一個初始字符;
對各字符圖像進(jìn)行特征提取,得到各初始字符對應(yīng)的圖像特征;
對所述生成語句進(jìn)行特征提取,得到所述生成語句中各字符對應(yīng)的文本特征;
基于所述圖像特征和所述文本特征,得到所述目標(biāo)語句的文本識別結(jié)果。
根據(jù)本公開的另一方面,提供了一種文本識別裝置,包括:
第一獲取模塊,用于獲取包含目標(biāo)語句的待處理圖像;所述目標(biāo)語句由多個初始字符組成;
第二獲取模塊,用于基于所述待處理圖像,獲取一組字符圖像以及與所述目標(biāo)語句對應(yīng)的生成語句;其中,每張字符圖像包括一個初始字符;
圖像特征提取模塊,用于對各字符圖像進(jìn)行特征提取,得到各初始字符對應(yīng)的圖像特征;
文本特征提取模塊,用于對所述生成語句進(jìn)行特征提取,得到所述生成語句中各字符對應(yīng)的文本特征;
文本識別模塊,用于基于所述圖像特征和所述文本特征,得到所述目標(biāo)語句的文本識別結(jié)果。
根據(jù)本公開的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:處理器;以及存儲程序的存儲器,其中,所述程序包括指令,所述指令在由所述處理器執(zhí)行時使所述處理器執(zhí)行根據(jù)上述文本識別方法。
根據(jù)本公開的另一方面,提供了一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì),所述計算機(jī)指令用于使所述計算機(jī)執(zhí)行根據(jù)文本識別方法。
本公開實(shí)施例提供的技術(shù)方案與現(xiàn)有技術(shù)相比具有如下優(yōu)點(diǎn):
本公開實(shí)施例提供的文本識別方法、裝置、設(shè)備及介質(zhì),該方法包括:獲取包含目標(biāo)語句的待處理圖像;目標(biāo)語句由多個初始字符組成;基于待處理圖像,獲取一組字符圖像以及與目標(biāo)語句對應(yīng)的生成語句;對各字符圖像進(jìn)行特征提取,得到各初始字符對應(yīng)的圖像特征;對生成語句進(jìn)行特征提取,得到生成語句對應(yīng)的文本特征;基于圖像特征和文本特征,得到目標(biāo)語句的文本識別結(jié)果。本公開能夠聯(lián)合圖像特征和文本特征,提升糾錯能力和文本識別結(jié)果的準(zhǔn)確性。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京世紀(jì)好未來教育科技有限公司,未經(jīng)北京世紀(jì)好未來教育科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210541217.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





