[發明專利]基于插件的發票識別方法有效
| 申請號: | 201710506334.X | 申請日: | 2017-06-28 |
| 公開(公告)號: | CN107358232B | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 衣楊;趙小蕾;王玉娟;石曉紅 | 申請(專利權)人: | 中山大學新華學院 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34 |
| 代理公司: | 廣州匯航專利代理事務所(普通合伙) 44537 | 代理人: | 呂詩 |
| 地址: | 510520 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 插件 發票 識別 方法 | ||
本發明公開了一種基于插件的發票識別方法、及識別與管理系統;其中,識別方法包括:將預先創建的識別插件導入到動態鏈接庫中;其中,識別插件基于適應于對應類型的發票的識別算法創建;獲取待識別的發票的圖像信息,及其類型;根據該待識別的發票的類型從動態鏈接庫中調取對應的識別插件以對該待識別的發票的圖像信息進行識別,進而獲取所需的發票信息。本發明的優點是:1、員工能夠自行錄入發票信息,把發票信息提交到后臺,供財務人員處理,從而減少財務人員的負擔;2、每當有新類型的發票出現時,可以動態地向系統中添加針對該類型發票的識別算法,使系統能夠識別新類型的發票,從工程角度解決多種發票識別問題。
技術領域
本發明涉及一種圖像識別技術,更具體地說,它涉及一種基于插件的發票識別方法、及識別與管理系統。
背景技術
在國外,許多公司致力于OCR的研究有許多研究,如美國AcuForm、俄羅斯ABBYY、法國A2iA等,其產品主要應用于會計業務、印刷業務等。俄羅斯ABBYY公司開發了一款專業OCR軟件ABBYY FineReader Professional。FineReader軟件不僅支持多種語言的識別,同時能對彩色文件進行識別,還有存在許多其他強大的功能。A2iA公司設計了一款支票識別軟件,該軟件不僅處理支票速度快而且識別率高[4]。隨著對OCR系統深入的研究,其產品也是應用在很多領域。
國外有眾多開源的OCR引擎,如Tesseract、Cuneiform、OCRopus等。 Tesseract早期是由惠普開發的OCR庫,后來由谷歌負責對其進行優化等工作。OCRopus是一款免費的文檔分析和光學字符識別系統,它通過使用插件允許OCRopus輕松地更換組件,在Apache許可證版本2.0下進行了非常模塊化的設計。這些開源的OCR引擎的發展,也使得票據識別有了快速的發展。
在國內,票據識別系統研究始于1988年。隨著票據識別技術不斷的成熟票據識別被廣泛用于各個行業。國內有許多票據識別公司,如漢王科技、云脈、文通、漢特等,其OCR產品具有強大的功能,不僅速度而且識別率高,還有針對某些特定行業的定制應用產品。漢王公司有許多OCR產品如名片識別、身份證識別、PDF與JPG格式文件識別等都有很高的識別率。
針對發票識別與管理系統,目前還處于根據發票模板定制階段,如云脈、漢王等公司提供增值稅發票等發票識別業務。漢特、金蝶和用友等公司專為公司提供財務軟件,但公司的財務軟件中僅僅是發票管理,或者僅僅提供一種定制的發票識別系統,系統可擴展性不強。
綜上所述,目前越來越多的公司投入到票據識別與管理系統當中,取得很多不錯的成果,但也存在許多不足。票據種類繁多,有些票據的識別已經達到商用的要求,但有些票據版面的識別還存在許多問題。對于票據識別與管理系統各大公司缺少一個系統化的方案,這方面還需要繼續研究。
發明內容
針對現有技術存在的不足,本發明的第一個目的在于提供一種基于插件的發票識別方法,能夠對多種不同類型的發票進行識別。
為實現上述目的,本發明提供了如下技術方案:
一種基于插件的發票識別方法,包括:
將預先創建的識別插件導入到動態鏈接庫中;其中,所述識別插件基于適應于對應類型的發票的識別算法創建;
獲取待識別的發票的圖像信息,及其類型;
根據該待識別的發票的類型從所述動態鏈接庫中調取對應的識別插件以對該待識別的發票的圖像信息進行識別,進而獲取所需的發票信息。
優選地,所述方法還包括:
將獲取到的發票信息存入到數據庫中。
優選地,所述識別算法包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學新華學院,未經中山大學新華學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710506334.X/2.html,轉載請聲明來源鉆瓜專利網。





