[發(fā)明專利]圖像識別的背景過濾方法在審
| 申請?zhí)枺?/td> | 201510979831.2 | 申請日: | 2015-12-23 |
| 公開(公告)號: | CN105426892A | 公開(公告)日: | 2016-03-23 |
| 發(fā)明(設(shè)計)人: | 田碩;陸費(fèi)漢平;姚濱暉 | 申請(專利權(quán))人: | 上海攜程商務(wù)有限公司 |
| 主分類號: | G06K9/40 | 分類號: | G06K9/40 |
| 代理公司: | 上海弼興律師事務(wù)所 31283 | 代理人: | 薛琦;王聰 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 識別 背景 過濾 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種圖像識別,尤其是涉及一種圖像識別的背景過濾方法。
背景技術(shù)
圖像識別是人工智能的一個重要領(lǐng)域。為了編制模擬人類圖像識別活動的計算機(jī)程序,人們提出了不同的圖像識別模型。圖像識別經(jīng)歷了三個階段的發(fā)展:文字識別,數(shù)字圖像處理與識別,物體識別。文字識別的研究是從1950年開始的,一般是識別字母,數(shù)字和符號,從印刷文字識別到手寫文字識別,應(yīng)用非常廣泛。
隨著智能手機(jī)興起,手機(jī)支付的行為越來越普及。但是用戶在手機(jī)上輸入銀行卡卡號時,速度很慢,需要仔細(xì)的校對,用戶體驗(yàn)很差。美國的PAYPAL、蘋果公司,中國的阿里和騰訊等公司都在自己的手機(jī)支付軟件上推出了銀行卡號識別的方案。
其中,包括信用卡在內(nèi)的銀行卡識別的一般流程如下:縱坐標(biāo)識別-Pattern識別-字符切分-字符識別-校驗(yàn)。銀行卡號的識別中的第一步即是針對卡號所在銀行卡的版面分析,識別卡號所在縱坐標(biāo),這一步的識別對于整個銀行卡的識別過程而言至關(guān)重要。而通過這種縱坐標(biāo)的識別,其目的就是希望能夠適當(dāng)?shù)貫V去背景,以使得后續(xù)的識別過程更為準(zhǔn)確。
然而,目前仍然缺少一種能夠針對淺色背景的凹凸字體的銀行卡卡號的縱坐標(biāo)識別方法,來進(jìn)行準(zhǔn)確的縱坐標(biāo)識別,這也進(jìn)而影響到了后續(xù)圖像識別的準(zhǔn)確性。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是為了克服現(xiàn)有技術(shù)中缺少一種能夠針對淺色背景的凹凸字體的銀行卡卡號的縱坐標(biāo)識別方法,從而致使背景過濾后續(xù)的圖像識別的準(zhǔn)確性不夠高的缺陷,提供一種圖像識別的背景過濾方法。
本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:
一種圖像識別的背景過濾方法,其特點(diǎn)在于,包括以下步驟:
步驟一、獲取原始圖像,使用加強(qiáng)的Prewitt算子對原始圖像濾波后得到濾波后圖像;
步驟二、將濾波后圖像分為若干條橫線,每一條橫線的寬度均為一個像素的高度;
步驟三、計算每一條橫線上灰度落入一預(yù)設(shè)灰度范圍的像素點(diǎn)的數(shù)量作為橫線的識別分?jǐn)?shù);
步驟四、根據(jù)每一條橫線的識別分?jǐn)?shù)進(jìn)行濾波后圖像的縱坐標(biāo)識別,以得到待識別圖像。
較佳地,步驟一的加強(qiáng)的Prewitt算子由下述公式定義:
若H1(i,j)>0且H2(i,j)>0,則P(i,j)=H1(i,j)+H2(i,j),否則P(i,j)=0,其中,H1(i,j)、H2(i,j)定義如下,
H1(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i-2,j)+f(i-2,j-1)+f(i-2,j+1)]
H2(i,j)=[f(i,j)+f(i,j-1)+f(i,j+1)]-[f(i+2,j)+f(i+2,j-1)+f(i+2,j+1)];
上述公式中,式中f(i,j)表示原始圖像中坐標(biāo)為(i,j)的像素點(diǎn)的灰度值,P(i,j)表示濾波后圖像中坐標(biāo)為(i,j)的像素點(diǎn)的灰度值,H1(i,j)和H2(i,j)分別表示坐標(biāo)為(i,j)的像素點(diǎn)所對應(yīng)的第一Prewitt算子和第二Prewitt算子。
本發(fā)明的技術(shù)方案,在已有的Prewitt算子的基礎(chǔ)上做了限制和加強(qiáng),使之得以有效、準(zhǔn)確地用于背景過濾。這種限制和加強(qiáng),實(shí)質(zhì)上可以理解為通過組合3*3的矩陣構(gòu)成5*5的矩陣,然后著眼于縱坐標(biāo)的識別而從5*5的矩陣中去掉縱分量。去掉縱分量的加強(qiáng)Prewitt算子相當(dāng)于兩個3×3的橫向Prewitt算子組合。添加約束條件為這兩個Prewitt算子的計算結(jié)果都為正,才判定計算結(jié)果有效。
由于加強(qiáng)的Prewitt算子,采用5×5的方格,把正反各兩組的Prewitt算子,分別放入相應(yīng)的位置。因此,加強(qiáng)的Prewitt算子,對于垂直和水平的小于3像素的細(xì)線,具有明顯更高的敏感度。在此基礎(chǔ)上,在去掉縱向分量后,算子的抗干擾能力例如排除水波、橫線等類型的圖像造成的干擾的能力大大加強(qiáng),提高了縱坐標(biāo)識別的性能。進(jìn)一步地,為了確保準(zhǔn)確識別出豎的細(xì)線,加上橫向的兩個Prewitt算子都大于0的條件或者說約束條件。
較佳地,本發(fā)明的方法尤其適合針對原始圖像為具有凹凸字體的卡片表面進(jìn)行識別。
較佳地,所述凹凸字體相比于卡片表面的其他區(qū)域呈淺色。
較佳地,所述卡片為銀行卡。
在符合本領(lǐng)域常識的基礎(chǔ)上,上述各優(yōu)選條件,可任意組合,即得本發(fā)明各較佳實(shí)例。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海攜程商務(wù)有限公司,未經(jīng)上海攜程商務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510979831.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





