[發明專利]一種發票關鍵信息識別方法及系統在審
| 申請號: | 201711190427.2 | 申請日: | 2017-11-24 |
| 公開(公告)號: | CN109840520A | 公開(公告)日: | 2019-06-04 |
| 發明(設計)人: | 湯斯鵬;陳曉冰;周實奇;張惠敏 | 申請(專利權)人: | 中國移動通信集團廣東有限公司;中國移動通信集團公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/00 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;吳歡燕 |
| 地址: | 510623 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 邏輯行 發票 圖像 預設區域 關鍵信息識別 關鍵信息 算法處理 候選框 檢測框 歸并 算法 非極大值抑制 極值區域 標注 自動化 篩選 檢測 | ||
1.一種發票關鍵信息識別方法,其特征在于,所述方法包括:
S1,利用最大穩定極值區域MSER算法對待識別發票的圖像中的文字進行檢測,得到用于標注所述圖像中的文字的多個候選框;
S2,利用非極大值抑制NMS算法對所述多個候選框進行篩選,得到與所述圖像中的文字一一對應的多個檢測框;
S3,對所述圖像中多個預設區域內的檢測框進行邏輯行歸并,在每個預設區域內得到至少一個邏輯行;
S4,從所述每個預設區域內的各邏輯行中識別所述待識別發票的關鍵信息。
2.根據權利要求1所述方法,其特征在于,在步驟S1之前還包括:
獲取所述待識別發票的原始圖像,并對所述原始圖像依次進行輪廓檢測、矩形框計算和仿射變換得到所述待識別發票的圖像。
3.根據權利要求2所述方法,其特征在于,在步驟S3之前還包括:
根據待識別發票中關鍵信息的分布,對所述圖像進行比例截取得到包含有關鍵信息的所述多個預設區域。
4.根據權利要求2所述方法,其特征在于,步驟S3具體包括:
在所述每個預設區域的圖像坐標系中,將最大縱坐標值處于多個第一預設范圍中任一第一預設范圍內的檢測框歸入同一邏輯行,在所述每個預設區域內得到至少一個邏輯行。
5.根據權利要求2所述方法,其特征在于,所述方法還包括:
若判斷獲知所述每個預設區域內的各邏輯行中的同一邏輯行存在多個關鍵信息時,則對所述同一邏輯行中的檢測框進行邏輯列歸并。
6.根據權利要求5所述方法,其特征在于,所述對所述同一邏輯行中的檢測框進行邏輯列歸并,具體包括:
在所述每個預設區域的圖像坐標系中,將最大橫坐標值處于多個第二預設范圍中任一第二預設范圍內的檢測框歸入同一邏輯列,得到多個邏輯列。
7.根據權利要求2所述方法,其特征在于,步驟S4具體包括:
采用開源的OCR識別工具從所述每個預設區域內的各邏輯行中識別所述待識別發票的關鍵信息。
8.一種發票關鍵信息識別系統,其特征在于,所述系統包括:
MSER算法處理模塊,用于利用最大穩定極值區域MSER算法對待識別發票的圖像中的文字進行檢測,得到用于標注所述圖像中的文字的多個候選框;
NMS算法處理模塊,用于利用非極大值抑制NMS算法對所述多個候選框進行篩選,得到與所述圖像中的文字一一對應的多個檢測框;
行歸并模塊,用于對所述圖像中多個預設區域內的檢測框進行邏輯行歸并,在每個預設區域內得到至少一個邏輯行;
信息識別模塊,用于從所述每個預設區域內的各邏輯行中識別所述待識別發票的關鍵信息。
9.一種計算機程序產品,其特征在于,所述計算機程序產品包括存儲在非暫態計算機可讀存儲介質上的計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執行時,使所述計算機執行如權利要求1至7任一項所述的方法。
10.一種非暫態計算機可讀存儲介質,其特征在于,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令使所述計算機執行如權利要求1至7任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團廣東有限公司;中國移動通信集團公司,未經中國移動通信集團廣東有限公司;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711190427.2/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





