[發(fā)明專利]一種3D壓印字符無分割序列識別方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910060884.2 | 申請日: | 2019-01-23 |
| 公開(公告)號: | CN109919150A | 公開(公告)日: | 2019-06-21 |
| 發(fā)明(設(shè)計(jì))人: | 游照林;向忠;錢淼;胡旭東 | 申請(專利權(quán))人: | 浙江理工大學(xué) |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62 |
| 代理公司: | 紹興市知衡專利代理事務(wù)所(普通合伙) 33277 | 代理人: | 施春宜 |
| 地址: | 310018 浙江省杭州市杭*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 壓印 序列識別 分割 字符序列 解碼 工藝步驟 圖像加權(quán) 序列特征 字符分割 字符圖像 創(chuàng)新性 識別率 顯著性 灰度 缺損 污染 變形 融合 檢測 | ||
本發(fā)明涉及一種3D壓印字符無分割序列識別方法及系統(tǒng),其包括如下工藝步驟:1),圖像加權(quán)融合;2),區(qū)域顯著性增強(qiáng);3),無分割序列特征提取;4),字符序列編碼;5),字符序列解碼與識別。本發(fā)明的3D壓印字符無分割序列識別方法不僅能檢測不同灰度、位置、角度的壓印字符,而且也適用于有重疊、缺損、污染等干擾的字符圖像,具有較高的創(chuàng)新性與實(shí)用性,能夠較好的解決3D壓印字符由于受到污染、干擾、變形等導(dǎo)致的字符分割精確度不足的問題,提高3D壓印字符的識別率。
【技術(shù)領(lǐng)域】
本發(fā)明涉及一種字符識別方法及系統(tǒng),具體涉及一種3D壓印字符無分割序列識別方法及系統(tǒng),屬于機(jī)器視覺與機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域。
【背景技術(shù)】
3D壓印字符的質(zhì)量與印刷字符相比受時(shí)間和現(xiàn)場的影響很小,所以近年來越來越多的被應(yīng)用到一些工業(yè)產(chǎn)品上,金屬標(biāo)牌、金屬零部件標(biāo)識和輪胎等。相應(yīng)地,對于3D壓印字符的自動識別也成為產(chǎn)品信息化管理的一個(gè)必然要求。對于量大面廣的機(jī)電產(chǎn)品,其標(biāo)牌上的3D壓印字符成為產(chǎn)品信息的重要載體,而且對大多的機(jī)電產(chǎn)品而言是唯一載體,其內(nèi)容往往代表著產(chǎn)品性能、規(guī)格、出廠代號、國家標(biāo)準(zhǔn)和生產(chǎn)日期等重要信息。
而3D壓印字符與一般利用前景和背景色差形成的字符相比,有著顯著的特點(diǎn):(1)標(biāo)準(zhǔn)字模有限,是有限字符集。(2)字符手感為凹凸不平,視覺上是利用“反光差”產(chǎn)生字符圖像,字符本身有較大的灰度差。(3)由于壓印字符與背景是同色,字符圖像質(zhì)量不佳,字符圖像的直方圖為單峰或多峰。(4)壓印字符有傾斜、字符間重疊、缺損等變形,字符周圍有較強(qiáng)的噪聲。
傳統(tǒng)的OCR字符識別算法一般是在二值化圖像上進(jìn)行字符分割及特征提取。但由于使用年限的增長及工業(yè)現(xiàn)場的復(fù)雜性,3D 壓印字符往往受到嚴(yán)重的污染,比如油污,粉塵,涂料等,而且有些3D字符可能出現(xiàn)變形、重觸、缺損等。這些會造成大量字符特征信息的丟失,在此基礎(chǔ)上獲得的特征就不能真正反映字符的特征,因此會造成分割錯(cuò)誤以及分類檢測的誤判。
因此,為解決上述技術(shù)問題,確有必要提供一種創(chuàng)新的3D壓印字符無分割序列識別方法及系統(tǒng),以克服現(xiàn)有技術(shù)中的所述缺陷。
【發(fā)明內(nèi)容】
為解決上述問題,本發(fā)明的目的在于提供一種3D壓印字符無分割序列識別方法,其不僅能檢測不同灰度、位置、角度的壓印字符,而且也適用于有重疊、缺損、污染等干擾的字符圖像,具有較高的創(chuàng)新性與實(shí)用性。
本發(fā)明的第二目的在于提供一種3D壓印字符無分割序列識別系統(tǒng)。
為實(shí)現(xiàn)上述第一目的,本發(fā)明采取的技術(shù)方案為:一種3D壓印字符無分割序列識別方法,其包括如下工藝步驟:
1),圖像加權(quán)融合:根據(jù)四副不同曝光強(qiáng)度圖像的對比度、飽和度、適度曝光量這三個(gè)測度因子生成原始多曝光圖像的權(quán)重圖,對其進(jìn)行加權(quán)平均后獲得綜合金字塔系數(shù),最后重建拉普拉斯金字塔得到融合圖像;
2),區(qū)域顯著性增強(qiáng):從非顯著像素中選擇初始背景種子,讓背景種子增長進(jìn)而檢測背景連通域,從而檢測出字符連通域;同時(shí)利用字符曲率顯著性特征來實(shí)現(xiàn)字符區(qū)域的顯著性增強(qiáng),該操作能夠提高步驟1)的融合結(jié)果圖前景與背景的對比度;
3),無分割序列特征提取:對步驟2)得到的圖像使用五層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行序列特征提取;其中包括二層卷積層,二層最大池化層,一層全連接層;
4),字符序列編碼:使用長短時(shí)記憶網(wǎng)絡(luò)(LSTM)來處理和預(yù)測步驟3)所提取的序列字符特征;
5),字符序列解碼與識別:將步驟(4)的結(jié)果輸入到基于神經(jīng)網(wǎng)絡(luò)的時(shí)序類分類的ctc(連接主義時(shí)間分類)模塊;該模塊能夠把網(wǎng)絡(luò)的輸出更改為所有可能標(biāo)簽序列的概率分布,通過梯度下降法和反向傳播法訓(xùn)練網(wǎng)絡(luò),序列解碼的目的是找到具有最大概率的近似最優(yōu)路徑,即最佳識別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江理工大學(xué),未經(jīng)浙江理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910060884.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





