[發(fā)明專利]圖像信息提取方法和裝置有效
| 申請?zhí)枺?/td> | 201810523909.3 | 申請日: | 2018-05-28 |
| 公開(公告)號: | CN109034159B | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計)人: | 伍更新;高大帥;李健;張連毅;武衛(wèi)東 | 申請(專利權(quán))人: | 北京捷通華聲科技股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海淀區(qū)東北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 信息 提取 方法 裝置 | ||
本發(fā)明提供了一種圖像信息提取方法和裝置,該方法包括:離線訓(xùn)練基于深度學(xué)習(xí)算法的預(yù)設(shè)模型,其中,預(yù)設(shè)模型包括文本行檢測模型、文本行識別模型、證件分類模型;采集證件文本的電子圖像;將預(yù)設(shè)模型加載至AI芯片上;將電子圖像輸入至預(yù)設(shè)模型中的每個模型;控制AI芯片運行證件分類模型以對電子圖像進行證件分類,確定電子圖像的證件類型;控制AI芯片依次運行文本行檢測模型和文本行識別模型以對電子圖像進行文本識別,確定電子圖像的不同位置的文本行的內(nèi)容信息;按照預(yù)設(shè)算法對不同位置的文本行的內(nèi)容信息進行識別處理,確定電子圖像的結(jié)構(gòu)化信息;輸出電子圖像的證件類型及結(jié)構(gòu)化信息。本發(fā)明提升圖像信息的提取實時性、準(zhǔn)確率、魯棒性。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別是涉及一種圖像信息提取方法和裝置。
背景技術(shù)
目前,在各種場景下普遍需要將證件、票據(jù)等信息錄入到計算機中;其中,信息的人工錄入步驟繁雜,成本較高且錯誤率較高。目前主要的錄入方式是基于OCR(光學(xué)字符識別技術(shù))的信息提取和錄入。
OCR信息提取流程具體包括:
步驟一,文本圖像采集:采用圖像采集設(shè)備獲取待錄入的文本圖像(例如身份證的電子圖像);
步驟二,文本行定位:使用傳統(tǒng)圖像處理算法(例如圖像濾波、圖像二值化等)對采集到的文本圖像進行傾斜校正、文字聚類生成文本行;
步驟三,文本識別:使用傳統(tǒng)gabor或hog特征進行文字識別;
步驟四,后處理:根據(jù)識別結(jié)果進行圖像的證件分類和信息提取。
其中,步驟二中的子步驟繁多,且每個子步驟中涉及的參數(shù)較多,各個子步驟需要認(rèn)真調(diào)節(jié)參數(shù)才能得到較好的定位結(jié)果,因此,魯棒性較差。而步驟三中的基于gabor和hog特征的識別算法對文字的識別準(zhǔn)確率較低。
由此可見,現(xiàn)有技術(shù)中的圖像信息提取方案普遍存在著信息提取準(zhǔn)確率低以及魯棒性差的問題。
發(fā)明內(nèi)容
本發(fā)明提供了一種圖像信息提取方法和裝置,以解決現(xiàn)有技術(shù)中的圖像信息提取方案所存在的信息提取準(zhǔn)確率低以及魯棒性差的問題。
為了解決上述問題,第一方面,本發(fā)明實施例提供了一種圖像信息提取方法,所述方法包括:
根據(jù)訓(xùn)練樣本離線訓(xùn)練基于深度學(xué)習(xí)算法的預(yù)設(shè)模型,其中,所述預(yù)設(shè)模型包括文本行檢測模型、文本行識別模型、證件分類模型;
采集證件文本的電子圖像;
將預(yù)先經(jīng)過訓(xùn)練的所述預(yù)設(shè)模型加載至AI芯片上;
將所述電子圖像輸入至所述預(yù)設(shè)模型中的每個模型;
控制所述AI芯片運行所述證件分類模型以對所述電子圖像進行證件分類,確定所述電子圖像的證件類型;
控制所述AI芯片依次運行所述文本行檢測模型和所述文本行識別模型以對所述電子圖像進行文本識別,確定所述電子圖像的不同位置的文本行的內(nèi)容信息;
按照預(yù)設(shè)算法對所述不同位置的文本行的內(nèi)容信息進行識別處理,確定所述電子圖像的結(jié)構(gòu)化信息;
輸出所述電子圖像的證件類型及所述結(jié)構(gòu)化信息。
第二方面,本發(fā)明實施例還提供了一種圖像信息提取裝置,所述圖像信息提取裝置包括AI芯片和預(yù)先經(jīng)過訓(xùn)練的預(yù)設(shè)模型,所述圖像信息提取裝置還包括:
訓(xùn)練模塊,用于根據(jù)訓(xùn)練樣本離線訓(xùn)練基于深度學(xué)習(xí)算法的預(yù)設(shè)模型,其中,所述預(yù)設(shè)模型包括文本行檢測模型、文本行識別模型、證件分類模型;
圖像采集模塊,用于采集證件文本的電子圖像;
加載模塊,用于將預(yù)先經(jīng)過訓(xùn)練的所述預(yù)設(shè)模型加載至AI芯片上;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京捷通華聲科技股份有限公司,未經(jīng)北京捷通華聲科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810523909.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





