[發明專利]一種票據處理系統和處理方法在審
| 申請號: | 201910067174.2 | 申請日: | 2019-01-24 |
| 公開(公告)號: | CN109858420A | 公開(公告)日: | 2019-06-07 |
| 發明(設計)人: | 楊李;孫淏添;王立;王兆強;胡文彬 | 申請(專利權)人: | 國信電子票據平臺信息服務有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/62;G06Q40/00 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100067 北京市豐臺區南四*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 票據 票據處理系統 關鍵文本 神經網絡模型 圖像信息提取 關鍵信息 票據處理 票據識別 神經網絡 信息查驗 有效地 云平臺 比對 驗證 | ||
本發明提供一種票據處理系統和處理方法。該方法包括:利用基于深度神經網絡的識別模型從票據的圖像信息提取關鍵文本信息;基于所述關鍵文本信息查驗票據的有效性;基于所述關鍵文本信息和電子底賬單的比對獲得所需的票據的全量信息。本發明的票據處理方法能夠基于深度神經網絡模型提取票據的關鍵信息,有效地驗證票據和獲取票據的全量信息,本發明的票據處理系統能夠進一步利用云平臺提高票據識別效率。
技術領域
本發明涉及財務票據信息化技術領域,尤其涉及一種票據處理系統和處理方法。
背景技術
票據種類繁多,除國家明文規定的票據格式外,各地有許多自制模板、不同字體的財務票據在現實財務系統中也非常常見,如電子發票,火車票,登機牌、各類機打發票等。在現有的財務工作中,為了將實物字面信息轉化成信息系統中的字符流,往往需要耗費大量的人力物力。此外,確保票據信息準確性也消耗大量的精力,如果出現微小的錯誤往往需要投入更多的人力物力進行復查。
目前,票據識別的通常做法是以制作模板的方式處理各式票據,然而,隨著票據種類、模板的增多,制作模板會造成額外的工作量,并且真實的票據和標準模板之間往往存在差距,從而造成定位和識別的錯誤。
因此,需要對現有技術進行改進,以提供效率更高、普適性更強的財務票據識別系統和識別方法。
發明內容
因此,本發明的目的在于克服上述現有技術的缺陷,提供一種財務票據處理系統和處理方法。
根據本發明的第一方面,提供了一種票據處理方法。該方法包括:
步驟1:利用基于深度神經網絡的識別模型從票據的圖像信息提取關鍵文本信息;
步驟2:基于所述關鍵文本信息查驗票據的有效性;
步驟3:基于所述關鍵文本信息和電子底賬單的比對獲得所需的票據的全量信息。
在一個實施例中,步驟1包括以下子步驟:
步驟12:利用所述基于深度神經網絡的識別模型對票據的圖像信息的文字區域進行切分框選,獲得文本區域;
步驟13:對所述文本區域進行文字識別,獲得文本內容;
步驟14:根據所述文本內容提取票據的所述關鍵文本信息。
在一個實施例中,步驟12包括以下子步驟:
將需要進行文字區域切分的圖像信息輸入到所述基于深度神經網絡的識別模型,輸出一組矩形錨,其中,該組矩形錨具有不同的位置、大小、朝向以及偏轉角度;
對于該組矩形錨,基于位置、角度的相近程度和距離信息組合為不同的文本框,進而獲得所述文本區域。
根據本發明的第二方面,提供一種票據處理系統。該系統包括:
第一票據識別子系統:用于利用基于深度神經網絡的識別模型從票據的圖像信息提取關鍵文本信息;
第一查驗模塊:用于基于所述關鍵文本信息查驗票據的有效性以及基于所述關鍵文本信息和電子底賬單的比對獲得所需的票據的全量信息。
第一模型庫,用于存儲所述識別模型,以供所述第一票據識別子系統提取所述關鍵文本信息
在一個實施例中,所述第一票據識別子系統、所述第一查驗模塊和所述第一模型庫位于客戶端,所述系統還包括服務器端,所述服務器端包括第二票據識別子系統和第二模型庫,其中:
所述第二票據識別子系統用于利用所述識別模型從票據的圖像信息提取關鍵文本信息;
所述第二模型庫用于存儲所述識別模型,以提供所述第二票據識別子系統提取所述關鍵文本信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信電子票據平臺信息服務有限公司,未經國信電子票據平臺信息服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910067174.2/2.html,轉載請聲明來源鉆瓜專利網。





