[發(fā)明專利]一種自適應的智能單據(jù)識別錄入裝置及其使用方法有效
| 申請?zhí)枺?/td> | 201910072775.2 | 申請日: | 2019-01-25 |
| 公開(公告)號: | CN109840519B | 公開(公告)日: | 2023-05-05 |
| 發(fā)明(設計)人: | 王營;李承濤;陳小二;盛楊;周鑫 | 申請(專利權)人: | 青島盈智科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V20/62;G06V30/24 |
| 代理公司: | 青島高曉專利事務所(普通合伙) 37104 | 代理人: | 張世功 |
| 地址: | 266000 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自適應 智能 單據(jù) 識別 錄入 裝置 及其 使用方法 | ||
1.一種自適應的智能單據(jù)識別錄入裝置,其特征在于:
包括有單據(jù)采集模塊:基于圖像識別的單據(jù)智能分析與自動存儲,其識別裝置包括有硬件掃描或者拍攝設備,用以去獲取紙質(zhì)單據(jù)圖像;
圖像預處理模塊:用以接收單據(jù)采集模塊采集的圖像,并對圖像進行膨脹算法的預處理,便于系統(tǒng)獲取結(jié)構(gòu)化的文字,以及文字或者表格的坐標位置,便于后期對文字進行相關性的分析,定位和提取;
文字識別模塊:對圖像預處理模塊中通過膨脹算法以及表格標記的各個小文本塊進行文字識別,通過對膨脹獲取的提取單元進行二值化處理,有效去除單據(jù)的背景及底圖的干擾,提高圖像的識別準確率,經(jīng)過二值化處理的圖片會更清晰,特征更明顯,有利于文字識別模塊進行文字識別;該文字識別方式能夠避免對整片文檔的大面積識別,針對預處理模塊分析出來的多個小區(qū)域進行識別,有效提高識別率,在文字識別模塊識別完成后,將處理后的數(shù)據(jù)傳輸至相關性分析模塊;
相關性分析模塊:相關性分析模塊是的核心模塊,能夠根據(jù)文字識別的結(jié)果和配置的相關規(guī)則,對文字的相關性進行分析,判斷各個文字識別塊之間的關系,判斷收貨人是在收貨人這個關鍵字的下面還是右面,對于人眼很容易正確匹配并判斷的信息,計算機并不具備人類的認知能力,計算機所讀取到的是一些文字,卻無法解讀其含義,以及文字之間的關系;能夠?qū)ξ谋局苯拥年P系做約定和配置,通過相關性分析,下一步將對文本做結(jié)構(gòu)分析獲得的各字段進行信息提取;
數(shù)據(jù)抽取模塊:相關性分析明確了文字識別塊之間的相互關系,數(shù)據(jù)抽取模塊根據(jù)相關性分析模塊中相關性分析的結(jié)果,對數(shù)據(jù)進行抽取工作,以獲取結(jié)構(gòu)化的數(shù)據(jù),并返回到調(diào)用方;抽取的方式如下,根據(jù)預先配置的需要抽取的數(shù)據(jù)字段,以及對應的關鍵字信息,進行數(shù)據(jù)的實際抽取,抽取時以相關性分析為依據(jù);數(shù)據(jù)抽取模塊根據(jù)上述的相關性分析,得到字段與文字的對應關系,并組織成第三方系統(tǒng)需要的數(shù)據(jù)格式JSON和XML,并將數(shù)據(jù)返回到第三方系統(tǒng);
數(shù)據(jù)存儲模塊:數(shù)據(jù)抽取后,系統(tǒng)對抽取結(jié)果保存到數(shù)據(jù)庫,以備后續(xù)糾錯時參考;
智能糾偏模塊:包括有設計核對子模塊,用以對識別結(jié)果做核對,以提高識別的準確率,通過對數(shù)據(jù)抽取模塊的數(shù)據(jù)抽取結(jié)果,以及數(shù)據(jù)抽取歷史和糾正結(jié)果的比對,對抽取的數(shù)據(jù)做自動的智能糾正;包括有對港口信息的糾正,針對單據(jù)中對港口信息描述不規(guī)范的情形,該模塊自動將識別結(jié)果與數(shù)據(jù)庫數(shù)據(jù)做比對,將錯誤的港口根據(jù)比對結(jié)果進行自動糾正;還包括有CBM前面的數(shù)字被錯誤的識別,該模塊將根據(jù)數(shù)據(jù)記憶和知識,自動找到KGS的值對重量和體積進行糾正;
人工矯正界面:人工矯正界面提供識別后的結(jié)果與原圖片,操作人員能夠點擊識別結(jié)果的內(nèi)容,智能糾偏模塊根據(jù)上述獲得的識別結(jié)果的對應坐標信息,自動框選原圖片的區(qū)域,便于操作人員進行核對和修改;操作人員通過設計核對界面矯正的結(jié)果將被保存到智庫,用于自動矯正糾偏,并為機器深度學習提供樣本,以便在后期進一步提高準確率。
2.根據(jù)權利要求1所述的一種自適應的智能單據(jù)識別錄入裝置,其特征在于圖像預處理模塊對圖像進行處理的具體方式按照如下步驟進行:對文本做相應的框選及結(jié)構(gòu)化處理,預處理將文檔分為文本格式和表格格式兩種;對文本格式,采用形態(tài)學圖像處理基本算法:膨脹,將整個圖片在橫向進行膨脹,將文字成塊分割出獨立的圖像元素塊,以及每塊圖像元素的坐標值;對于表格格式,單個表格的Cell中的內(nèi)容即為要提取的某個字段的內(nèi)容,需要保持表格內(nèi)的內(nèi)容的完整性以及表格結(jié)構(gòu)的完整性,并且不能把單個Cell中的內(nèi)容與其他內(nèi)容混淆,給后續(xù)文本分割帶來更大的困難,通過圖片線形結(jié)構(gòu)元素的形狀提取算法,分別提取表格的橫向和豎向的線形矩陣,得到表格中所有的交點坐標,再根據(jù)每條線形元素的坐標,還原成原圖的表格形狀,并記錄所有表格CELL的坐標信息。
3.根據(jù)權利要求1所述的一種自適應的智能單據(jù)識別錄入裝置,其特征在于中文字識別模塊采用現(xiàn)有的OCR方案,能夠支持對文本某個固定區(qū)域的文字識別,采用OCR技術,對預處理過的圖片塊做文字識別,得到每個文本塊的文本內(nèi)容和表格Cell內(nèi)文本內(nèi)容;文字信息依據(jù)被分割成多個小塊,能有效提高文字識別的準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島盈智科技有限公司,未經(jīng)青島盈智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910072775.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





