[發(fā)明專利]基于稀疏理論的字符識別方法有效
| 申請?zhí)枺?/td> | 201310618572.1 | 申請日: | 2013-11-29 |
| 公開(公告)號: | CN103679209B | 公開(公告)日: | 2017-03-29 |
| 發(fā)明(設(shè)計(jì))人: | 李陽根;方秀敏;應(yīng)李勇;馬海 | 申請(專利權(quán))人: | 廣東領(lǐng)域安防有限公司 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 廣東省汕頭市龍湖區(qū)汕頭高新區(qū)科*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 稀疏 理論 字符 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種標(biāo)牌字符的自動識別方法,特別涉及一種基于稀疏理論的字符識別方法,屬于字符識別技術(shù)領(lǐng)域。
背景技術(shù)
標(biāo)牌字符自動識別是現(xiàn)代社會發(fā)展和進(jìn)步的表現(xiàn),也是信息化、智能化管理的一個(gè)方向。其中,車牌自動識別是標(biāo)牌字符識別的一個(gè)重要領(lǐng)域,也是現(xiàn)代交通智能化管理的重要手段。
車牌識別技術(shù)是指:能夠自動檢測受控路面車輛并提取車輛牌照信息的處理技術(shù),包括漢字字符、英文字母和阿拉伯?dāng)?shù)字的區(qū)分以及號牌顏色的識別。其以數(shù)字圖像處理、模式識別、計(jì)算機(jī)視覺等技術(shù)為基礎(chǔ),對攝像機(jī)所拍攝的車輛圖像或者視頻序列進(jìn)行分析,得到每一輛汽車唯一的車牌號碼,從而完成識別過程。識別后的車牌通過一些后續(xù)處理手段不僅可以實(shí)現(xiàn)停車場或高速公路收費(fèi)管理、車輛出入管理、交通流量指標(biāo)控制測量、公路超速自動化監(jiān)管、違章處罰管理等,還可以實(shí)現(xiàn)車輛定位、汽車防盜等防控技術(shù)管理,保證了車輛使用安全性,對于維護(hù)交通安全和城市治安,防止交通堵塞,實(shí)現(xiàn)交通自動化管理有著現(xiàn)實(shí)的意義。
車牌自動識別是一項(xiàng)利用車輛的動態(tài)視頻或靜態(tài)圖像進(jìn)行牌照號碼、牌照顏色自動識別的模式識別技術(shù)。其硬件基礎(chǔ)一般包括觸發(fā)設(shè)備、攝像設(shè)備、照明設(shè)備、圖像采集設(shè)備、識別車牌號碼的處理機(jī)等,其軟件核心包括車牌定位算法、車牌字符分割算法和光學(xué)字符識別算法等。
當(dāng)前,國內(nèi)做車牌識別的廠商有幾十家,其中字符識別部分基本上都是基于兩類技術(shù):一類是模板匹配;另一類是基于神經(jīng)網(wǎng)絡(luò)的分類器技術(shù)。模板匹配技術(shù)算法簡單,但運(yùn)算量大,抗干擾能力較弱,對二值化的要求較高,綜合識別率不高;神經(jīng)網(wǎng)絡(luò)技術(shù)的優(yōu)點(diǎn)是運(yùn)算量小,但對字符特征的選取很敏感,魯棒性并不高,同樣存在抗干擾能力弱等缺陷。
如何改善相關(guān)字符識別技術(shù),基于現(xiàn)有硬件設(shè)備的基礎(chǔ)上,提高字符識別速度和準(zhǔn)確性,就成為本發(fā)明想要解決的主要問題。
發(fā)明內(nèi)容
鑒于上述現(xiàn)有識別技術(shù)的不足,本發(fā)明旨在提供一種基于稀疏理論算法,直接訓(xùn)練灰度圖像,省去了二值化圖像的過程,避免了二值化對圖像信息產(chǎn)生的損失和失真,從而達(dá)到提高字符識別率的目的。
本發(fā)明是通過以下技術(shù)方案來實(shí)現(xiàn)的:
一種基于稀疏理論的字符識別方法,具體步驟包括:
步驟一:建立測試樣本集,人工區(qū)分并假設(shè)測試樣本集中含有n個(gè)類,每個(gè)樣本中的數(shù)據(jù)為1位以上。
步驟二:從測試樣本集中每個(gè)類里抽出一個(gè)樣本(D1,D2,D3.....,Dn)作為訓(xùn)練樣本train_data,Train_data=[D1D2D3.....Dn];隨機(jī)挑選一個(gè)測試樣本Dt作為測試樣本Test_data,Test_data=[Dt]。
步驟三:將訓(xùn)練樣本灰度歸一化為一個(gè)訓(xùn)練矩陣train_lab,計(jì)算得出訓(xùn)練矩陣的秩x2x,x2x平方和再開方后生成Y2Y,Y2Y的逆矩陣和訓(xùn)練矩陣的轉(zhuǎn)置矩陣相乘得到一個(gè)新的矩陣Proj_M。
步驟四:將Test_data的灰度值歸一化后生成Test_data2,將Test_data2中的樣本逐一跟這個(gè)新的矩陣Proj_M計(jì)算,得到一組值S,S為系數(shù)向量,測試數(shù)據(jù)、訓(xùn)練數(shù)據(jù)與S的關(guān)系為:
Test_data=Train_data*S
步驟五:按照S尋找train_data中相應(yīng)的訓(xùn)練項(xiàng),求出train_data中所有類訓(xùn)練項(xiàng)與測試數(shù)據(jù)的差異矩陣gap,gap中各項(xiàng)為train_data中與S值對應(yīng)的相同類所有數(shù)據(jù)與測試樣本的誤差總和除以此類對應(yīng)的S值的平方;得出所有類的gap值后,其最小值所對應(yīng)的就是測試樣本所應(yīng)歸屬的類。
步驟六:對比步驟五中測試樣本所應(yīng)歸屬的類是否與步驟一中的人工分類相同,如相同,則識別正確;否則,為識別錯(cuò)誤,將測試樣本加入到訓(xùn)練樣本中。
步驟七:依次循環(huán)上述步驟二至步驟六,直到所有測試樣本都能識別正確為止。
本發(fā)明所述的基于稀疏理論的字符識別方法,通過訓(xùn)練灰度圖像,省去了二值化圖像的過程,避免了二值化對圖像信息產(chǎn)生的損失和失真,同時(shí),對輸入數(shù)據(jù)優(yōu)化選擇,選擇差異性較大的個(gè)體作為訓(xùn)練樣本,訓(xùn)練樣本少而精,訓(xùn)練樣本中具有大部分有效數(shù)據(jù),較少的冗余數(shù)據(jù),有效減少了無效數(shù)據(jù)的影響,提高了識別率。其基于稀疏理論的識別方法具有識別速度快,識別效率高,抗干擾能力強(qiáng)的特點(diǎn),單個(gè)字符的識別率可以達(dá)到99.2%。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東領(lǐng)域安防有限公司,未經(jīng)廣東領(lǐng)域安防有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310618572.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





