[發明專利]發票圖像分類方法、裝置、設備及存儲介質有效
| 申請號: | 202110692213.5 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113342977B | 公開(公告)日: | 2022-10-28 |
| 發明(設計)人: | 姬小玉 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06V10/764;G06V30/40 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 劉麗華 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發票 圖像 分類 方法 裝置 設備 存儲 介質 | ||
1.一種發票圖像分類方法,其特征在于,所述發票圖像分類方法包括:
當接收到分類請求時,根據所述分類請求確定待分類發票;
識別所述待分類發票中預設標簽對應的待分析文本,并對所述待分析文本進行分詞處理,得到文本分詞;
根據預設詞庫及所述文本分詞對所述待分類發票進行分類,得到初始類別;
若所述初始類別有多個,根據所述文本分詞對所述待分析文本進行向量化處理,得到第一向量,并對從所述待分類發票中識別出的項目信息進行向量化處理,得到第二向量;
根據預先訓練好的發票類型識別模型對所述第一向量及所述第二向量進行類型識別,得到模型類別;
根據所述初始類別及所述模型類別生成所述待分類發票的目標類別,包括:計算每個初始類別在多個所述初始類別中的類別數量;獲取所述預設詞庫的預測準確度作為第一數值,并獲取所述發票類型識別模型的預測準確度作為第二數值;計算所述第一數值與所述第二數值的總和,得到基準值;計算所述第一數值在所述基準值中的占比,得到所述預設詞庫的詞庫權值,并計算所述第二數值在所述基準值中的占比,得到所述發票類型識別模型的模型權值;將所述初始類別及所述模型類別確定為預測類別;根據所述類別數量、所述詞庫權值、所述模型類別及所述模型權值生成每個預測類別的預測比值;從所述預測比值中獲取取值最大的比值作為目標比值;若所述目標比值大于配置值,將所述目標比值對應的預測類別確定為所述目標類別。
2.如權利要求1所述的發票圖像分類方法,其特征在于,所述根據所述分類請求確定待分類發票包括:
解析所述分類請求的報文,得到所述報文攜帶的數據信息;
從所述數據信息中獲取指示數據庫的信息作為第一庫標識及第二庫標識;
將所述第一庫標識對應的數據庫確定為主庫,并將所述第二庫標識對應的數據庫確定為從庫;
當檢測到所述從庫中的發票總值與所述主庫中相應總值不同時,將生成所述發票總值所對應的發票確定為所述待分類發票。
3.如權利要求1所述的發票圖像分類方法,其特征在于,所述識別所述待分類發票中預設標簽對應的待分析文本包括:
確定所述待分類發票的發票尺寸;
從預設位置映射表中獲取同時與所述發票尺寸及所述預設標簽對應的標簽位置;
從預設關聯表中獲取同時與所述發票尺寸及所述標簽位置關聯的文本位置;
根據所述文本位置從所述待分類發票中提取發票特征圖;
對所述發票特征圖進行字符檢測,得到所述待分析文本。
4.如權利要求1所述的發票圖像分類方法,其特征在于,所述對所述待分析文本進行分詞處理,得到文本分詞包括:
計算所述待分析文本的字符總量;
從預設詞典中獲取字數量與所述字符總量相同的詞匯作為待配對詞組;
依次將所述待分析文本中每個第一字符與所述待配對詞組中每個第二字符進行比較;
若任意所述第一字符與相應位置上的所述第二字符不同,將所述待分析文本中最末位置的字符剔除,得到待確定詞組,并將所述待確定詞組與所述預設詞典中的詞匯進行匹配,直至所述待確定詞組與所述預設詞典中任意詞匯相同,得到所述文本分詞。
5.如權利要求1所述的發票圖像分類方法,其特征在于,所述對從所述待分類發票中識別出的項目信息進行向量化處理,得到第二向量包括:
從所述待分類發票中識別出所述項目信息;
確定所述第一向量的生成映射表;
基于所述生成映射表對所述項目信息進行向量化處理,得到所述第二向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110692213.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種戰斗部毀傷部件預制裝置
- 下一篇:地址脫敏方法、裝置、電子設備及存儲介質
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





