[發(fā)明專利]基于模板匹配的OCR識別方法及裝置、存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910127136.1 | 申請日: | 2019-02-20 |
| 公開(公告)號: | CN110008944A | 公開(公告)日: | 2019-07-12 |
| 發(fā)明(設(shè)計)人: | 高梁梁 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62 |
| 代理公司: | 北京中強智尚知識產(chǎn)權(quán)代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 518000 廣東省深圳市福田街*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文檔圖片 模板數(shù)據(jù)庫 樣本文檔 存儲介質(zhì) 模板匹配 文檔類型 邊框 采集 信息處理技術(shù) 計算機設(shè)備 圖片 排版方式 排版格式 框選 文檔 調(diào)用 申請 保存 | ||
本申請公開了一種基于模板匹配的OCR識別方法及裝置、存儲介質(zhì)、計算機設(shè)備,涉及信息處理技術(shù)領(lǐng)域。其中方法包括:采集不同指定排版方式的樣本文檔圖片;對各個樣本文檔圖片進行框選,獲得與各個樣本文檔圖片對應(yīng)的識別模板;建立識別模板數(shù)據(jù)庫,所述識別模板數(shù)據(jù)庫中保存有所述各個樣本文檔圖片對應(yīng)的識別模板;采集待識別文檔圖片,并對所述待識別文檔圖片的邊框以及標題進行識別,獲得所述待識別文檔圖片的文檔類型;根據(jù)識別得到的待識別文檔圖片的文檔類型調(diào)用所述識別模板數(shù)據(jù)庫中相應(yīng)的識別模板對所述待識別文檔圖片進行OCR識別。本申請建立了識別模板數(shù)據(jù)庫,能適應(yīng)多種不同排版格式的文檔的識別,提高了OCR識別的準確性。
技術(shù)領(lǐng)域
本申請涉及信息處理技術(shù)領(lǐng)域,尤其是涉及到一種基于模板匹配的OCR識別方法及裝置、存儲介質(zhì)、計算機設(shè)備。
背景技術(shù)
光學字符識別(Optical Character Recognition,OCR)方法是指通過電子設(shè)備(例如掃描儀或數(shù)碼相機)獲得紙質(zhì)文檔的電子文檔,將電子文檔中的字符串切分開,形成包含單個字符的小圖片,然后使用一定的方法對切分后的文字進行識別。
現(xiàn)有的OCR識別方法因為待識別圖片中字符排版多樣等因素,只能較為準確的識別身份證、銀行卡等字符排版固定的圖片,但是對其他文檔的圖片識別效果較差。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┝艘环N基于模板匹配的OCR識別方法及裝置、存儲介質(zhì)、計算機設(shè)備,主要目的在于解決現(xiàn)有OCR識別方法識別效果差的問題。
根據(jù)本申請的一個方面,提供了一種基于模板匹配的OCR識別方法,該方法包括:
采集不同指定排版方式的樣本文檔圖片;
對各個樣本文檔圖片進行框選,獲得與各個樣本文檔圖片對應(yīng)的識別模板;
建立識別模板數(shù)據(jù)庫,所述識別模板數(shù)據(jù)庫中保存有所述各個樣本文檔圖片對應(yīng)的識別模板;
采集待識別文檔圖片,并對所述待識別文檔圖片的邊框以及標題進行識別,獲得所述待識別文檔圖片的文檔類型;
根據(jù)識別得到的待識別文檔圖片的文檔類型調(diào)用所述識別模板數(shù)據(jù)庫中相應(yīng)的識別模板對所述待識別文檔圖片進行OCR識別。
可選地,所述對所述待識別文檔圖片的邊框以及標題進行識別,獲得所述待識別文檔圖片的文檔類型,包括:
對所述待識別文檔圖片進行二值化處理,獲取二值化表格圖像;
基于透視變化的傾斜校正算法,對所述二值化表格圖像進行傾斜校正;
基于傾斜校正后的二值化表格圖像采用圖像形態(tài)學處理方法提取所述待識別文檔圖片的邊框;
對所述傾斜校正后的二值化表格圖像的預(yù)設(shè)區(qū)域進行OCR識別,獲得所述待識別文檔圖片的標題;
根據(jù)所述待識別文檔圖片的邊框和標題獲得所述待識別文檔圖片的文檔類型。
可選地,所述對所述待識別文檔圖片進行OCR識別,包括:
采用卷積循環(huán)神經(jīng)網(wǎng)絡(luò)模型對所述待識別文檔圖片進行OCR識別。
可選地,所述卷積循環(huán)神經(jīng)網(wǎng)絡(luò)模型包括神經(jīng)網(wǎng)絡(luò)CNN、雙向循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM和聯(lián)接時間分類CTC模型;
所述采用卷積循環(huán)神經(jīng)網(wǎng)絡(luò)模型對所述待識別文檔圖片進行OCR識別,包括:
神經(jīng)網(wǎng)絡(luò)CNN提取所述待識別文檔圖片的識別區(qū)域的特征,生成該識別區(qū)域的特征序列;
雙向循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM確定特征序列中的各個特征對應(yīng)的標簽分布列表;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910127136.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于接合與分離存儲介質(zhì)的裝置
- 存儲介質(zhì)陣列控制器、控制方法、設(shè)備、和存儲介質(zhì)驅(qū)動器
- 存儲介質(zhì)處理方法、系統(tǒng)及數(shù)據(jù)讀寫操作方法、系統(tǒng)
- 存儲裝置、存儲介質(zhì)以及存儲介質(zhì)的制造方法
- 數(shù)據(jù)存儲
- 存儲介質(zhì)之間的數(shù)據(jù)遷移
- 一種基于存儲系統(tǒng)的控制方法及裝置
- 自助設(shè)備及自助設(shè)備的介質(zhì)存儲裝置
- 融合存儲系統(tǒng)中的數(shù)據(jù)遷移方法和裝置
- 一種數(shù)據(jù)存儲方法、裝置及電子設(shè)備





