[發(fā)明專利]文字識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110068580.8 | 申請(qǐng)日: | 2021-01-19 |
| 公開(kāi)(公告)號(hào): | CN112861648B | 公開(kāi)(公告)日: | 2023-09-26 |
| 發(fā)明(設(shè)計(jì))人: | 劉翔;劉瑩 | 申請(qǐng)(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號(hào): | G06V30/40 | 分類號(hào): | G06V30/40;G06V30/14;G06V30/19;G06V10/82;G06N3/044;G06N3/049;G06T5/50;G06T7/11 |
| 代理公司: | 深圳市沃德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文字 識(shí)別 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及圖像檢測(cè)領(lǐng)域,揭露了一種文字識(shí)別方法,包括:獲取文本圖像,對(duì)所述文本圖像進(jìn)行文字檢測(cè),得到文字檢測(cè)框;對(duì)所述文字檢測(cè)框進(jìn)行篩選及合并,得到目標(biāo)文字框;對(duì)所述目標(biāo)文字框進(jìn)行無(wú)文字區(qū)域裁剪,得到裁剪文字框;對(duì)所述裁剪文字框進(jìn)行文字提取,得到初始文字集。提取所述初始文字集中的關(guān)鍵文字,并利用正則校驗(yàn)技術(shù)對(duì)所述關(guān)鍵文字進(jìn)行校驗(yàn),將檢驗(yàn)成功的所述關(guān)鍵文字作為所述文本圖像的文字識(shí)別結(jié)果。此外,本發(fā)明還涉及區(qū)塊鏈技術(shù),所述關(guān)鍵文字可存儲(chǔ)于區(qū)塊鏈中。本發(fā)明可以提高文字識(shí)別的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像檢測(cè)領(lǐng)域,尤其涉及一種文字識(shí)別方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
文字識(shí)別是指提取文本圖像中文字的一個(gè)過(guò)程,例如在政府部門(mén)在進(jìn)行官文審查時(shí),為了提取其中的重要信息,往往需要對(duì)官文圖像中的文字進(jìn)行識(shí)別。目前文字識(shí)別通常采用光學(xué)字符識(shí)別(Optical?Character?Recognition,OCR)實(shí)現(xiàn),所述OCR是指對(duì)文本資料的文件圖像進(jìn)行分析識(shí)別處理,獲取文字及版面信息的過(guò)程。
但是在利用OCR進(jìn)行文本圖像的文字識(shí)別時(shí),無(wú)法準(zhǔn)確定位到文本圖像中文字位置和文字方向,這樣容易導(dǎo)致識(shí)別出的文字準(zhǔn)確率不高的現(xiàn)象。
發(fā)明內(nèi)容
本發(fā)明提供一種文字識(shí)別方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其主要目的在于提高文字識(shí)別的準(zhǔn)確性。
為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種文字識(shí)別方法,包括:
獲取文本圖像,對(duì)所述文本圖像進(jìn)行文字檢測(cè),得到文字檢測(cè)框;
對(duì)所述文字檢測(cè)框進(jìn)行篩選及合并,得到目標(biāo)文字框;
對(duì)所述目標(biāo)文字框進(jìn)行無(wú)文字區(qū)域裁剪,得到裁剪文字框;
利用對(duì)所述裁剪文字框進(jìn)行文字提取,得到初始文字集;
提取所述初始文字集中的關(guān)鍵文字,并利用正則校驗(yàn)技術(shù)對(duì)所述關(guān)鍵文字進(jìn)行校驗(yàn),將檢驗(yàn)成功的所述關(guān)鍵文字作為所述文本圖像的文字識(shí)別結(jié)果。
可選地,所述所述文本圖像進(jìn)行文字檢測(cè),得到文字檢測(cè)框,包括:
利用文字目標(biāo)框檢測(cè)模型中的卷積層對(duì)所述文本圖像進(jìn)行圖像特征提取,得到特征圖像,所述文字目標(biāo)框檢測(cè)模型是預(yù)先訓(xùn)練完成的;
利用所述文字目標(biāo)框檢測(cè)模型中批標(biāo)準(zhǔn)化層對(duì)所述特征圖像進(jìn)行標(biāo)準(zhǔn)化操作,得到標(biāo)準(zhǔn)特征圖像;
利用所述文字目標(biāo)框檢測(cè)模型中融合層將所述文本圖像的底層特征與所述標(biāo)準(zhǔn)特征圖像進(jìn)行融合,得到目標(biāo)特征圖像;
利用所述文字目標(biāo)框檢測(cè)模型中激活函數(shù)輸出所述目標(biāo)特征圖像的檢測(cè)結(jié)果,根據(jù)所述檢測(cè)結(jié)果,生成文字檢測(cè)框。
可選地,所述對(duì)所述目標(biāo)文字框進(jìn)行無(wú)文字區(qū)域裁剪,得到裁剪文字框,包括:
對(duì)所述目標(biāo)文字框進(jìn)行二值化處理,得到二值化文字框;
查詢所述二值化文字框中縱軸方向的文字起始位置和文字終止位置以及所述二值化文字框的縱軸方向長(zhǎng)度,根據(jù)所述縱軸方向的文字起始位置、文字終止位置以及縱軸方向長(zhǎng)度,對(duì)所述二值化文字框進(jìn)行縱向裁剪,得到縱向裁剪文字框;
查詢所述縱向裁剪文字框中橫軸方向的文字起始位置和文字終止位置以及所述縱向裁剪文字框的橫軸方向長(zhǎng)度,根據(jù)所述橫軸方向的文字起始位置和文字終止位置以及橫軸方向長(zhǎng)度,對(duì)所述縱向裁剪文字框進(jìn)行橫向裁剪,得到裁剪文字框。
可選地,所述對(duì)所述裁剪文字框進(jìn)行文字提取,得到初始文字集,包括:
利用文字提取模型中的卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述裁剪文字框進(jìn)行特征提取,得到特征文字框,所述文字提取模型是預(yù)先訓(xùn)練完成的;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110068580.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





