[發(fā)明專利]一種圖片文本識(shí)別方法、裝置及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202210429147.7 | 申請(qǐng)日: | 2022-04-22 |
| 公開(公告)號(hào): | CN114821615A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 田廣庫;金圣海 | 申請(qǐng)(專利權(quán))人: | 東軟集團(tuán)股份有限公司 |
| 主分類號(hào): | G06V30/413 | 分類號(hào): | G06V30/413;G06V30/148;G06V20/62 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 馬小青 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖片 文本 識(shí)別 方法 裝置 設(shè)備 | ||
本申請(qǐng)公開了一種圖片文本識(shí)別方法、裝置及設(shè)備,先獲取模板圖像,模板圖像中標(biāo)記有目標(biāo)錨點(diǎn)文本、目標(biāo)錨點(diǎn)文本對(duì)應(yīng)的目標(biāo)錨點(diǎn)位置以及目標(biāo)識(shí)別框位置。進(jìn)而,識(shí)別待識(shí)別圖像中包括的錨點(diǎn)文本以及錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置。利用目標(biāo)錨點(diǎn)文本對(duì)應(yīng)的目標(biāo)錨點(diǎn)位置以及待識(shí)別圖像中包括的錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置,確定表征待識(shí)別圖像與所述模板圖像之間映射關(guān)系的投影矩陣。利用投影矩陣將待識(shí)別圖像進(jìn)行投影映射,生成轉(zhuǎn)換后的待識(shí)別圖像。根據(jù)目標(biāo)識(shí)別框位置,確定轉(zhuǎn)換后的待識(shí)別圖像中的識(shí)別框位置。進(jìn)而,對(duì)識(shí)別框位置中包括的文本進(jìn)行識(shí)別。如此,通過標(biāo)注模板圖像,就可以將與模板圖像同類圖像中關(guān)鍵文本抽取出來,提高了圖像文本識(shí)別的效率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種圖片文本識(shí)別方法、裝置及設(shè)備。
背景技術(shù)
光學(xué)字符識(shí)別(Optical Character Recognition,OCR)指的是通過掃描或拍攝物體表面得到對(duì)應(yīng)的圖像,再基于文本識(shí)別方法獲取圖像中文本的過程。例如,通過OCR技術(shù)可獲取身份證上的文本、發(fā)票上的文本等。
身份證等證件票據(jù)往往具備統(tǒng)一的格式,如果需要識(shí)別存在固定格式圖像中的關(guān)鍵文本,目前能夠通過針對(duì)每類圖像分別建立工程,以按照預(yù)設(shè)規(guī)則提取圖像中包括的關(guān)鍵文本。但是,不同的機(jī)構(gòu)和業(yè)務(wù)流程中包含大量不同類型的圖像,不可能針對(duì)每類圖像去建立工程。因此,如何快速提取圖像中的關(guān)鍵文本是亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
有鑒于此,本申請(qǐng)實(shí)施例提供一種圖片文本識(shí)別方法、裝置及設(shè)備,以實(shí)現(xiàn)快速提取圖像中的關(guān)鍵文本。
為解決上述問題,本申請(qǐng)實(shí)施例提供的技術(shù)方案如下:
一種圖片文本識(shí)別方法,獲取模板圖像,所述模板圖像中標(biāo)記有目標(biāo)錨點(diǎn)文本、所述目標(biāo)錨點(diǎn)文本對(duì)應(yīng)的目標(biāo)錨點(diǎn)位置以及目標(biāo)識(shí)別框位置,所述方法包括:
識(shí)別待識(shí)別圖像中包括的錨點(diǎn)文本以及所述錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置;
利用所述目標(biāo)錨點(diǎn)文本對(duì)應(yīng)的目標(biāo)錨點(diǎn)位置以及所述待識(shí)別圖像中包括的錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置,確定表征所述待識(shí)別圖像與所述模板圖像之間映射關(guān)系的投影矩陣;
根據(jù)所述投影矩陣將所述待識(shí)別圖像進(jìn)行投影映射,生成轉(zhuǎn)換后的待識(shí)別圖像;
根據(jù)所述目標(biāo)識(shí)別框位置,確定所述轉(zhuǎn)換后的待識(shí)別圖像中的識(shí)別框位置;
識(shí)別所述識(shí)別框位置中包括的文本。
在一種可能的實(shí)現(xiàn)方式中,所述識(shí)別待識(shí)別圖像中包括的錨點(diǎn)文本以及所述錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置,包括:
識(shí)別待識(shí)別圖像中包括的文本框區(qū)域;
識(shí)別所述文本框區(qū)域中各個(gè)文本字符對(duì)應(yīng)的位置;
識(shí)別所述文本框區(qū)域中包括的文字;
將所述文本框區(qū)域中包括的文字與所述目標(biāo)錨點(diǎn)文本進(jìn)行匹配,得到所述待識(shí)別圖像中包括的錨點(diǎn)文本;
根據(jù)所述各個(gè)文本字符對(duì)應(yīng)的位置,確定所述待識(shí)別圖像中包括的錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置。
在一種可能的實(shí)現(xiàn)方式中,所述識(shí)別待識(shí)別圖像中包括的錨點(diǎn)文本以及所述錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置,包括:
識(shí)別待識(shí)別圖像中包括的文本框區(qū)域;
識(shí)別所述文本框區(qū)域中包括的文字;
將所述文本框區(qū)域中包括的文字與所述目標(biāo)錨點(diǎn)文本進(jìn)行匹配,得到所述待識(shí)別圖像中包括的錨點(diǎn)文本;
將所述待識(shí)別圖像中包括的錨點(diǎn)文本進(jìn)行文字切割,得到所述待識(shí)別圖像中包括的錨點(diǎn)文本對(duì)應(yīng)的錨點(diǎn)位置。
在一種可能的實(shí)現(xiàn)方式中,所述識(shí)別待識(shí)別圖像中包括的文本框區(qū)域,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東軟集團(tuán)股份有限公司,未經(jīng)東軟集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210429147.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





