[發明專利]發票圖像分類方法、裝置、設備及存儲介質有效
| 申請號: | 202110692213.5 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113342977B | 公開(公告)日: | 2022-10-28 |
| 發明(設計)人: | 姬小玉 | 申請(專利權)人: | 深圳壹賬通智能科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06V10/764;G06V30/40 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 劉麗華 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發票 圖像 分類 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能,提供一種發票圖像分類方法、裝置、設備及存儲介質。該方法能夠根據分類請求確定待分類發票,識別待分類發票中預設標簽對應的待分析文本,對待分析文本進行分詞處理,得到文本分詞,根據預設詞庫及文本分詞對待分類發票進行分類,得到初始類別,若初始類別有多個,根據文本分詞對待分析文本進行向量化處理,得到第一向量,對從待分類發票中識別出的項目信息進行向量化處理,得到第二向量,根據發票類型識別模型對第一向量及第二向量進行類型識別,得到模型類別,根據初始類別及模型類別生成目標類別。本發明能夠準確的確定出發票圖像的類別。此外,本發明還涉及區塊鏈技術,所述目標類別可存儲于區塊鏈中。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種發票圖像分類方法、裝置、設備及存儲介質。
背景技術
在目前的發票圖像自動分類方式中,通常是直接利用訓練好的模型對待分類發票中的信息進行分析,然而,這種方式是從單個維度上確定出待分類發票所對應的類別,導致分類準確度低下。
因此,如何構建準確的發票圖像分類方案,成了有待解決的技術問題。
發明內容
鑒于以上內容,有必要提供一種發票圖像分類方法、裝置、設備及存儲介質,能夠準確的確定出發票圖像的類別。
一方面,本發明提出一種發票圖像分類方法,所述發票圖像分類方法包括:
當接收到分類請求時,根據所述分類請求確定待分類發票;
識別所述待分類發票中預設標簽對應的待分析文本,并對所述待分析文本進行分詞處理,得到文本分詞;
根據預設詞庫及所述文本分詞對所述待分類發票進行分類,得到初始類別;
若所述初始類別有多個,根據所述文本分詞對所述待分析文本進行向量化處理,得到第一向量,并對從所述待分類發票中識別出的項目信息進行向量化處理,得到第二向量;
根據預先訓練好的發票類型識別模型對所述第一向量及所述第二向量進行類型識別,得到模型類別;
根據所述初始類別及所述模型類別生成所述待分類發票的目標類別。
根據本發明優選實施例,所述根據所述分類請求確定待分類發票包括:
解析所述分類請求的報文,得到所述報文攜帶的數據信息;
從所述數據信息中獲取指示數據庫的信息作為第一庫標識及第二庫標識;
將所述第一庫標識對應的數據庫確定為主庫,并將所述第二庫標識對應的數據庫確定為從庫;
當檢測到所述從庫中的發票總值與所述主庫中相應總值不同時,將生成所述發票總值所對應的發票確定為所述待分類發票。
根據本發明優選實施例,所述識別所述待分類發票中預設標簽對應的待分析文本包括:
確定所述待分類發票的發票尺寸;
從預設位置映射表中獲取同時與所述發票尺寸及所述預設標簽對應的標簽位置;
從所述預設關聯表中獲取同時與所述發票尺寸及所述標簽位置關聯的文本位置;
根據所述文本位置從所述待分類發票中提取發票特征圖;
對所述發票特征圖進行字符檢測,得到所述待分析文本。
根據本發明優選實施例,所述對所述待分析文本進行分詞處理,得到文本分詞包括:
計算所述待分析文本的字符總量;
從預設詞典中獲取字數量與所述字符總量相同的詞匯作為待配對詞組;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳壹賬通智能科技有限公司,未經深圳壹賬通智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110692213.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種戰斗部毀傷部件預制裝置
- 下一篇:地址脫敏方法、裝置、電子設備及存儲介質
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





