[發(fā)明專利]圖像信息提取方法和裝置有效

申請?zhí)枺?/td>	201810523909.3	申請日：	2018-05-28
公開（公告）號：	CN109034159B	公開（公告）日：	2021-05-28
發(fā)明（設(shè)計）人：	伍更新;高大帥;李健;張連毅;武衛(wèi)東	申請（專利權(quán)）人：	北京捷通華聲科技股份有限公司
主分類號：	G06K9/34	分類號：	G06K9/34;G06K9/62
代理公司：	北京潤澤恒知識產(chǎn)權(quán)代理有限公司 11319	代理人：	莎日娜
地址：	100193 北京市海淀區(qū)東北***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	圖像信息提取方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明提供了一種圖像信息提取方法和裝置，該方法包括：離線訓(xùn)練基于深度學(xué)習(xí)算法的預(yù)設(shè)模型，其中，預(yù)設(shè)模型包括文本行檢測模型、文本行識別模型、證件分類模型；采集證件文本的電子圖像；將預(yù)設(shè)模型加載至AI芯片上；將電子圖像輸入至預(yù)設(shè)模型中的每個模型；控制AI芯片運行證件分類模型以對電子圖像進行證件分類，確定電子圖像的證件類型；控制AI芯片依次運行文本行檢測模型和文本行識別模型以對電子圖像進行文本識別，確定電子圖像的不同位置的文本行的內(nèi)容信息；按照預(yù)設(shè)算法對不同位置的文本行的內(nèi)容信息進行識別處理，確定電子圖像的結(jié)構(gòu)化信息；輸出電子圖像的證件類型及結(jié)構(gòu)化信息。本發(fā)明提升圖像信息的提取實時性、準(zhǔn)確率、魯棒性。

技術(shù)領(lǐng)域

本發(fā)明涉及圖像處理技術(shù)領(lǐng)域，特別是涉及一種圖像信息提取方法和裝置。

背景技術(shù)

目前，在各種場景下普遍需要將證件、票據(jù)等信息錄入到計算機中；其中，信息的人工錄入步驟繁雜，成本較高且錯誤率較高。目前主要的錄入方式是基于OCR(光學(xué)字符識別技術(shù))的信息提取和錄入。

OCR信息提取流程具體包括：

步驟一，文本圖像采集：采用圖像采集設(shè)備獲取待錄入的文本圖像(例如身份證的電子圖像)；

步驟二，文本行定位：使用傳統(tǒng)圖像處理算法(例如圖像濾波、圖像二值化等)對采集到的文本圖像進行傾斜校正、文字聚類生成文本行；

步驟三，文本識別：使用傳統(tǒng)gabor或hog特征進行文字識別；

步驟四，后處理：根據(jù)識別結(jié)果進行圖像的證件分類和信息提取。

其中，步驟二中的子步驟繁多，且每個子步驟中涉及的參數(shù)較多，各個子步驟需要認(rèn)真調(diào)節(jié)參數(shù)才能得到較好的定位結(jié)果，因此，魯棒性較差。而步驟三中的基于gabor和hog特征的識別算法對文字的識別準(zhǔn)確率較低。

由此可見，現(xiàn)有技術(shù)中的圖像信息提取方案普遍存在著信息提取準(zhǔn)確率低以及魯棒性差的問題。

發(fā)明內(nèi)容

本發(fā)明提供了一種圖像信息提取方法和裝置，以解決現(xiàn)有技術(shù)中的圖像信息提取方案所存在的信息提取準(zhǔn)確率低以及魯棒性差的問題。

為了解決上述問題，第一方面，本發(fā)明實施例提供了一種圖像信息提取方法，所述方法包括：

根據(jù)訓(xùn)練樣本離線訓(xùn)練基于深度學(xué)習(xí)算法的預(yù)設(shè)模型，其中，所述預(yù)設(shè)模型包括文本行檢測模型、文本行識別模型、證件分類模型；

采集證件文本的電子圖像；

將預(yù)先經(jīng)過訓(xùn)練的所述預(yù)設(shè)模型加載至AI芯片上；

將所述電子圖像輸入至所述預(yù)設(shè)模型中的每個模型；

控制所述AI芯片運行所述證件分類模型以對所述電子圖像進行證件分類，確定所述電子圖像的證件類型；

控制所述AI芯片依次運行所述文本行檢測模型和所述文本行識別模型以對所述電子圖像進行文本識別，確定所述電子圖像的不同位置的文本行的內(nèi)容信息；

按照預(yù)設(shè)算法對所述不同位置的文本行的內(nèi)容信息進行識別處理，確定所述電子圖像的結(jié)構(gòu)化信息；

輸出所述電子圖像的證件類型及所述結(jié)構(gòu)化信息。

第二方面，本發(fā)明實施例還提供了一種圖像信息提取裝置，所述圖像信息提取裝置包括AI芯片和預(yù)先經(jīng)過訓(xùn)練的預(yù)設(shè)模型，所述圖像信息提取裝置還包括：

訓(xùn)練模塊，用于根據(jù)訓(xùn)練樣本離線訓(xùn)練基于深度學(xué)習(xí)算法的預(yù)設(shè)模型，其中，所述預(yù)設(shè)模型包括文本行檢測模型、文本行識別模型、證件分類模型；

圖像采集模塊，用于采集證件文本的電子圖像；

加載模塊，用于將預(yù)先經(jīng)過訓(xùn)練的所述預(yù)設(shè)模型加載至AI芯片上；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京捷通華聲科技股份有限公司，未經(jīng)北京捷通華聲科技股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810523909.3/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】