[發明專利]憑證圖像識別方法及裝置在審
| 申請號: | 201611189226.6 | 申請日: | 2016-12-21 |
| 公開(公告)號: | CN106650718A | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 魯靜;宋斌;向萬紅 | 申請(專利權)人: | 遠光軟件股份有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 珠海智專專利商標代理有限公司44262 | 代理人: | 林永協,李謹 |
| 地址: | 519085 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 憑證 圖像 識別 方法 裝置 | ||
技術領域
本發明涉及圖像自動識別領域,尤其涉及一種對各種憑證進行光學字符識別后對憑證的內容進行識別的方法以及實現這種方法的裝置。
背景技術
人們在日常的消費過程中,往往產生大量的憑證,如乘坐飛機,將會有登機牌或者航程單,乘坐火車或汽車會有火車票或者汽車票,到餐館吃飯可以獲得餐飲發票等,這些憑證都是財務報銷的依據,因此,如人們在差旅過程中產生這些憑證,在差旅結束后需要將這些憑證交給財務部門,由財務部門核實并且予以報銷。
由于憑證種類眾多,且每一張憑證均包含大量的數據,以火車票為例,憑證上包括乘車日期、乘客姓名、車次號、乘車日期與時間、座號、乘客身份證號碼、金額等,報銷時往往需要將這些信息錄入到報銷系統中。如果人工地將這些信息錄入系統,工作量將非常巨大。此外,在人數眾多的企業,差旅報銷的憑證數量巨大,如每一張憑證均人工錄入,將嚴重影響財務部門的工作量。
為此,人們開發出基于光學字符識別(OCR,optical character recognition)的憑證圖像識別系統,即通過光學字符識別技術將憑證上的字符識別出來,將識別出來的字符自動填寫到報銷系統相應的欄目上,從而避免人工輸入憑證信息。使用這種系統時,需要通過拍攝裝置將憑證拍照,然后使用報銷系統對拍攝的憑證圖像進行光學字符識別,從而獲取相應的信息。
目前普遍的基于光學字符識別的報銷系統都只能識別出憑證上的文字和符號,而不能分析原始憑證的版面結構,也不能理解憑證上的內容。在對憑證做光學字符識別后,需要設計模板對憑證進行版面分析,以理解識別出的字符的具體含義。傳統的做法是設計一個固定模板對憑證信息進行框選,用戶拍攝憑證時將固定目標對準憑證圖像。然而固定模板“套不準”的情況經常發生,不僅影響識別率,也影響了用戶體驗。此外,固定模板僅適用于結構固定、元素位置相對不變的憑證,而實際應用時即使同類憑證的版面結構也并不是一成不變的,如火車票的版面也經常發生變化。正因如此,現有的憑證圖像識別系統無法高效、準確的識別憑證圖像,影響財務報銷的效率。
發明內容
本發明的主要目的是提供一種能夠對不同類型、不同版面的憑證圖像進行高效識別的憑證圖像識別方法。
本發明的另一目的是提供一種能夠高效地對識別不同類型憑證的憑證識別裝置。
為了實現上述的主要目的,本發明提供的憑證識別方法包括讀取憑證圖像,對所讀取的憑證圖像進行光學字符識別;并且,提取憑證圖像的特征信息,根據特征信息判斷憑證圖像是否與固定結構的模板匹配,如是,則提取憑證圖像中的特征元素的數據;如判斷憑證圖像不與任一固定結構的模板匹配,則進一步判斷憑證圖像是否為特定分類的憑證,如是,將憑證圖像與該分類的彈性模板匹配,并識別憑證圖像中的特征元素,提取特征元素的數據;如判斷憑證圖像不是特定分類的憑證,則將憑證圖像的特征信息遍歷所有模板,并查找到最匹配的模板后識別憑證圖像中的特征元素,提取憑證圖像中的特征元素的數據。
由上述方案可見,提取憑證圖像的特征信息后,首先判斷圖像憑證是否與固定結構的模板匹配,如匹配則直接按照固定結構的模板提取特征元素的數據,如果不是與固定結構的模板匹配,則通過分類器判斷憑證是否為特定分類的憑證,并且通過匹配彈性模板的方式識別出各個特征元素,從而獲取各個特征元素的數據。
這樣,在識別憑證圖像時,并不會只能對固定結構的模板進行識別,并且一旦判斷不與固定結構的模板匹配時,也不會直接遍歷所有模板,而是識別出憑證的分類后,通過匹配彈性模板的方式查找出憑證的分類,并且根據彈性模板分析出憑證上各個特征元素,再提取特征元素的數據,從而避免花費較長時間遍歷所有模板,憑證圖像識別的時間大大縮短。
一個優選的方案是,每一彈性模板包括所屬特定分類中至少一個特征元素。由于彈性模板是特定分類的憑證,因此憑證圖像應該包含有所屬分類的憑證的特征元素,因此識別憑證圖像時,分析出憑證圖像中所屬分類的憑證的特征元素,可以提高憑證圖像的識別效率。
進一步的方案是,特征信息至少包括靜態文本、特殊符號、分隔符、條碼或二維碼、空白區域中的一個。
由此可見,通過識別憑證圖像中諸如靜態文本、特殊符號、分隔符、條碼或二維碼、空白區域的特征來辨別憑證圖像的分類,可以快速確定憑證的類型,從而快速獲取憑證圖像中的特征元素的數據。
更進一步的方案是,判斷憑證圖像是否為特定分類的憑證包括:搜索憑證圖像中的靜態文本后,搜索憑證圖像中的特征元素的字段,并搜索已查找的特征元素的鄰近字段,根據靜態文本、特征元素的字段確定憑證圖像的分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遠光軟件股份有限公司,未經遠光軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611189226.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:抱枕(圖形創意)
- 下一篇:識別圖片文字的方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





