[發(fā)明專利]一種自適應(yīng)的智能單據(jù)識(shí)別錄入裝置及其使用方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910072775.2 | 申請(qǐng)日: | 2019-01-25 |
| 公開(公告)號(hào): | CN109840519B | 公開(公告)日: | 2023-05-05 |
| 發(fā)明(設(shè)計(jì))人: | 王營(yíng);李承濤;陳小二;盛楊;周鑫 | 申請(qǐng)(專利權(quán))人: | 青島盈智科技有限公司 |
| 主分類號(hào): | G06V30/14 | 分類號(hào): | G06V30/14;G06V20/62;G06V30/24 |
| 代理公司: | 青島高曉專利事務(wù)所(普通合伙) 37104 | 代理人: | 張世功 |
| 地址: | 266000 山*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自適應(yīng) 智能 單據(jù) 識(shí)別 錄入 裝置 及其 使用方法 | ||
發(fā)明屬于圖像識(shí)別處理領(lǐng)域,涉及一種自適應(yīng)的智能單據(jù)識(shí)別錄入裝置及其使用方法,數(shù)據(jù)采集模塊將客戶的紙質(zhì)文本通過掃描或者拍攝,采集成圖片文件,預(yù)處理模塊會(huì)利用形態(tài)學(xué)處理算法,對(duì)圖像中的文本做分塊處理,將每行或者表格中的格子做成不等的小區(qū)塊,文字識(shí)別模塊將各個(gè)小區(qū)塊通過二值處理;然后相關(guān)性分析模塊根據(jù)預(yù)先配置的關(guān)鍵字及規(guī)則,對(duì)文本塊的關(guān)系做分析,并指導(dǎo)數(shù)據(jù)抽取模塊對(duì)需要的字段內(nèi)容做提取,糾偏模塊會(huì)根據(jù)先前的識(shí)別及糾偏歷史數(shù)據(jù),對(duì)提取的內(nèi)容做一些校驗(yàn)和自動(dòng)糾正,最終保存結(jié)果,并返回?cái)?shù)據(jù)到調(diào)用方。其設(shè)計(jì)構(gòu)思巧妙,使用安全方便,智能化程度高,同時(shí)識(shí)別準(zhǔn)確度高,應(yīng)用環(huán)境友好,市場(chǎng)前景廣闊。
技術(shù)領(lǐng)域:
發(fā)明屬于圖像識(shí)別處理領(lǐng)域,涉及一種物流單據(jù)的識(shí)別裝置,特別是一種自適應(yīng)的智能單據(jù)識(shí)別錄入裝置及其使用方法。
背景技術(shù):
在空運(yùn),海運(yùn)等進(jìn)出口業(yè)務(wù)中,業(yè)務(wù)過程中流轉(zhuǎn)的單據(jù)格式及類型(如:客戶委托單,船公司訂艙回執(zhí)單等)多樣,有可以直接拷貝內(nèi)容的word,excel,textual?PDF等格式,也有相當(dāng)一部分是圖片格式的文件,或者干脆是紙質(zhì)文件。由于歷史的原因,來自全球各地的空運(yùn)及海運(yùn)單據(jù)的類型非常多,行業(yè)內(nèi)對(duì)客戶單據(jù)沒有統(tǒng)一格式標(biāo)準(zhǔn),甚至單個(gè)客戶也會(huì)提供多種格式的單據(jù)。這種情況下,對(duì)一些體量大的物流或者是貨物代理公司,在面對(duì)幾百上千個(gè)客戶的時(shí)候,每天產(chǎn)生的單據(jù)流轉(zhuǎn)量非常巨大,類型格式也相當(dāng)多,據(jù)統(tǒng)計(jì),一個(gè)幾十人的中等規(guī)模的貨代公司每個(gè)月流轉(zhuǎn)的單據(jù)就幾千甚至上萬份。如果要把單據(jù)里面的內(nèi)容再逐個(gè)錄入到自己的ERP或者是其它業(yè)務(wù)系統(tǒng),工作程序繁瑣,工作量大,需要大量的手工人力工作,同時(shí)也容易在操作錄入過程中出現(xiàn)差錯(cuò)。
為了解決上述類似的問題,申請(qǐng)?zhí)枮镃N201710800489.4的中國(guó)專利公開了一種基于圖像識(shí)別的物流單據(jù)智能分析與自動(dòng)存儲(chǔ)方法,該方法公開了一種基于圖像識(shí)別的物流單據(jù)智能分析與自動(dòng)存儲(chǔ)方法,包括識(shí)別裝置,所述識(shí)別裝置包括:掃描拍攝模塊,圖形分割模塊,圖片處理模塊,智能識(shí)別模塊,等多個(gè)模塊,該方法能夠自動(dòng)識(shí)別圖片中的文字信息,對(duì)文字信息做進(jìn)一步的對(duì)比和判斷,并且將信息結(jié)果保存起來,并可通過人工修改后經(jīng)過自我學(xué)習(xí)豐富自己的文字庫(kù)從而提高以后識(shí)別的效率和準(zhǔn)確性,該種圖片文字識(shí)別方法主要針對(duì)手寫體做識(shí)別優(yōu)化,識(shí)別范圍只能對(duì)固定格式的國(guó)內(nèi)快遞運(yùn)單做內(nèi)容識(shí)別,對(duì)文字的布局,位置版面有格式要求。要求面單尺寸較小,內(nèi)容不多,無法實(shí)現(xiàn)大篇幅的無固定格式的文字識(shí)別及提取功能。
申請(qǐng)?zhí)枮镃N201810087635.8的中國(guó)專利公開了一種識(shí)別糾偏系統(tǒng)及方法,對(duì)紙質(zhì)單據(jù)信息進(jìn)行數(shù)據(jù)化處理,包括:圖像獲取單元,用于獲取紙質(zhì)單據(jù)圖像;識(shí)別單元,用于識(shí)別所述單據(jù)圖像中的文字,得到單據(jù)的識(shí)別結(jié)果數(shù)據(jù)集;信息糾偏單元,用于對(duì)所述識(shí)別結(jié)果數(shù)據(jù)集進(jìn)行糾偏,得到糾偏后的單據(jù)信息;數(shù)據(jù)存儲(chǔ)單元,用于存儲(chǔ)信息數(shù)據(jù)庫(kù)、所述單據(jù)圖像、所述單據(jù)的識(shí)別結(jié)果數(shù)據(jù)集及所述糾偏后的單據(jù)信息。其中,所述信息數(shù)據(jù)庫(kù)為所述信息糾偏單元的訓(xùn)練數(shù)據(jù)。發(fā)明涉及的是一種識(shí)別糾偏系統(tǒng)和方法,改善了OCR技術(shù)識(shí)別文字序列精度、準(zhǔn)確率較低的弊端。該方法對(duì)手寫單據(jù)的識(shí)別率較低的問題提供了一種識(shí)別糾偏系統(tǒng)和方法,改善了OCR技術(shù)識(shí)別文字序列精度準(zhǔn)確率較低的弊端。
但是上述專利中OCR技術(shù)對(duì)識(shí)別對(duì)象有格式要求,需要通過模板的方式,對(duì)需要提取的內(nèi)容圖片用人工的方式做對(duì)應(yīng)的模板,識(shí)別系統(tǒng)就根據(jù)模板標(biāo)注的固定位置坐標(biāo)識(shí)別相應(yīng)區(qū)域的文本,以達(dá)到文字提取的目的。但這中做法仍存在如下缺陷:
一是需要人工做模板,增加工作量,尤其是要支持大量單據(jù)的情況下,需要定制很多模板,在業(yè)務(wù)員的實(shí)際操作層面非常麻煩,操作員面對(duì)大量模板的選擇工作將變得非常繁瑣。
二是對(duì)固定格式的文本做框選有時(shí)候不夠精準(zhǔn),在填寫的信息存在錯(cuò)位并且沒有與固定格式完全對(duì)應(yīng)時(shí),做模板的時(shí)候就很難定位框選的尺寸大小,特別是錯(cuò)位的內(nèi)容較多時(shí),那么有些內(nèi)容在識(shí)別中很有可能會(huì)被漏掉;
三是對(duì)于尺寸較小的單據(jù)如果格式非常固定,可能可以做到準(zhǔn)確度比較高,但對(duì)于A4甚至更大版面的單據(jù),包含更多內(nèi)容的委托書就更難通過固定模板來達(dá)到目的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島盈智科技有限公司,未經(jīng)青島盈智科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910072775.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 一種業(yè)務(wù)單據(jù)的核銷方法及系統(tǒng)
- 應(yīng)收款發(fā)票核銷方法和裝置
- 單據(jù)編碼生成的方法和裝置
- 一種單據(jù)模板的管理方法、調(diào)用單據(jù)的方法及相關(guān)裝置
- 一種整合單據(jù)的方法及裝置
- 一種待簽單據(jù)的工作流定義、制作和審批方法
- 供需單據(jù)的調(diào)整方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 金融單據(jù)和業(yè)務(wù)單據(jù)的掛接方法及終端設(shè)備
- 一種單據(jù)生成方法、信息管理系統(tǒng)及存儲(chǔ)介質(zhì)
- 單據(jù)作業(yè)流程的管理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





