[發明專利]票據識別方法、系統、計算機設備與計算機可讀存儲介質有效
| 申請號: | 202010977474.7 | 申請日: | 2020-09-17 |
| 公開(公告)號: | CN111931784B | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 王文浩;徐國強 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/32;G06T3/00 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 鄧小玲 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 票據 識別 方法 系統 計算機 設備 可讀 存儲 介質 | ||
本發明實施例公開了一種票據識別方法、系統、計算機設備與計算機可讀存儲介質,方法包括:通過模板票據圖片的第一參考字段區域中的文本對待處理票據圖片中文本的進行匹配,得到目標文本,并通過識別模型將目標文本對應的第一目標位置區域進行框選,再建立第一參考字段區域對應的第一位置信息與目標文本的第一目標位置信息之間的變換矩陣,最后通過變換矩陣獲取第二目標位置信息;且對待處理票據的第二目標位置信息通過第一位置信息與第二位置信息的重疊度值進行調整。本發明實施例還可以應用于數字醫療中的電子處方簽中,其有益效果在于:提高了多行識別的精確度。
技術領域
本發明實施例涉及發票識別領域,尤其涉及一種票據識別方法、系統、計算機設備與計算機可讀存儲介質。
背景技術
伴隨著企業經營管理規模的擴大與業務的拓展,財務部門需要審核整理票據的工作量也是與日俱增,每月都要面對大量的紙質票據,并將這些紙質票據中的內容轉化為可存儲的結構化信息。以及在醫療行業中,有大量的處方簽需要進行識別轉化成可存儲的文字信息。
目前而言,多數中小企業對于票據的處理主要依賴于人工手動進行票據信息的錄入,處方簽也需要通過人工錄入,該方式不僅效率低、周期長,而且在高強度重復工作壓力下難免精神懈怠導致工作錯誤。對于技術高度發達的今天,顯然這種模式已經不能滿足人們對效率和智能化的追求。針對上述問題,可以通過光學字符識別(OCR)技術,借助光學設備,使用票據識別技術,實現票信息結構化自動錄入。
現有產品中,百度開發的iOCR自定義模板文字識別系統能夠實現只需上傳一張模板圖片,即可自助制作識別模型,建立圖片中文字的key-value對應關系,實現對相同版式圖片的結構化識別功能。但該產品對于票據中:1、參考固定字段(key)與待識別區域(value)打印錯位;2、識別區域中含有多行文字內容的情況,導致識別效果較差。
發明內容
有鑒于此,本發明實施例的目的是提供一種票據識別方法、系統、計算機設備與計算機可讀存儲介質,提高了多行識別的精確度。
為實現上述目的,本發明實施例提供了一種票據識別方法,包括:
獲取模板票據圖片,所述模板票據圖片包括框選的第一參考字段區域以及第二參考字段區域;
將所述模板票據圖片輸入至文字識別模型,以識別出所述第一參考字段區域中的文本,并通過檢測模型輸出所述第一參考字段區域的第一位置信息與所述第二參考字段區域的第二位置信息;
接收待處理票據圖片,并將所述待處理票據圖片輸入至所述文字識別模型,識別出與所述文本匹配的目標文本,并通過所述檢測模型框選標記所述目標文本的第一識別區域與第一目標位置信息;
根據所述第一位置信息與所述第一目標位置信息建立變換矩陣;
通過所述變換矩陣計算所述第二位置信息,得到所述待處理票據圖片中第二識別區域的第二目標位置信息;
根據所述第一位置信息與所述第二位置信息的重疊度值,調整所述第二目標位置信息,得到待識別區域,并通過所述文字識別模型識別所述待識別區域中的文本,得到識別結果。
進一步地,所述獲取模板票據圖片,所述模板票據圖片包括框選的第一參考字段區域以及第二參考字段區域包括:
選取標準圖片格式的票據圖片作為模板票據圖片;
框選出文字條的字段內容作為第一參考字段區域以及所述文字條對應的數據內容作為第二參考字段區域。
進一步地,所述通過檢測模型輸出所述第一參考字段區域的第一位置信息與所述第二參考字段區域的第二位置信息包括:
通過所述檢測模型對所述第一參考字段區域與所述第二參考字段區域進行邊框識別,得到第一參考字段區域的第一邊框頂點與所述第二參考字段區域對應的第二邊框頂點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010977474.7/2.html,轉載請聲明來源鉆瓜專利網。





