[發(fā)明專利]一種字符識別的方法及裝置在審
| 申請?zhí)枺?/td> | 201710193761.7 | 申請日: | 2017-03-28 |
| 公開(公告)號: | CN107016417A | 公開(公告)日: | 2017-08-04 |
| 發(fā)明(設(shè)計)人: | 王亞軍;張立凱;湯子海 | 申請(專利權(quán))人: | 青島偉東云教育集團(tuán)有限公司 |
| 主分類號: | G06K9/68 | 分類號: | G06K9/68 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司11415 | 代理人: | 陳蕾 |
| 地址: | 266000 山東省青島*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 字符 識別 方法 裝置 | ||
技術(shù)領(lǐng)域
本申請涉及計算機(jī)識別技術(shù)領(lǐng)域,特別涉及字符識別的方法及裝置。
背景技術(shù)
目前,很多場景都會應(yīng)用到字符識別技術(shù),例如:在閱卷過程中,對于掃描至電腦的試卷,試題、答案部分的評閱主要靠人工完成,對于學(xué)號、姓名、分?jǐn)?shù)的部分記錄和統(tǒng)計則可以通過計算機(jī)的識別來完成。這就要求計算機(jī)對數(shù)字及文字的識別達(dá)到一定的準(zhǔn)確率。
以對試卷中字符的識別為例,現(xiàn)有技術(shù)中,由于要求作為識別對象的圖像文件格式統(tǒng)一,尺寸固定,所以首先會將試卷的紙件掃描為圖像文件,并按照預(yù)設(shè)的固定坐標(biāo)截取學(xué)號、姓名以及分?jǐn)?shù)等目標(biāo)圖像區(qū)域。然后通過HOG(Histogram of Oriented Gradient,方向梯度直方圖)計算和統(tǒng)計目標(biāo)圖像的梯度方向直方圖來生成HOG特征描述子,最后將生成的HOG特征描述子輸入預(yù)先訓(xùn)練好的支持向量機(jī)SVM(Support Vector Machine)分類器進(jìn)行識別。但是,由于試卷的掃描由人工完成,其最后生成的圖像文件存在一定偏差,如果按照預(yù)設(shè)固定坐標(biāo)截取目標(biāo)圖像,則會使截取的目標(biāo)圖像也出現(xiàn)偏差,甚至是截取到非目標(biāo)圖像區(qū)域,最終導(dǎo)致識別錯誤或失敗。可見,現(xiàn)有的字符識別技術(shù)識別的準(zhǔn)確率較低。
發(fā)明內(nèi)容
本發(fā)明實施例提供字符識別的方法和裝置,用于解決現(xiàn)有技術(shù)識別的準(zhǔn)確率較低的問題。
根據(jù)本發(fā)明實施例的第一方面,提供一種字符識別的方法,其特征在于,所述方法應(yīng)用于對圖像中字符的識別,所述圖像中包括不確定位置的文本框,所述字符填寫在所述文本框中,所述方法包括:
確定文本框在待識別圖像中所處的位置;
根據(jù)所述文本框的位置,截取所述待識別圖像中文本框?qū)?yīng)的目標(biāo)圖像;
計算所述目標(biāo)圖像所對應(yīng)的目標(biāo)方向梯度直方圖HOG特征描述算子;
根據(jù)所述目標(biāo)HOG特征描述子以及預(yù)先訓(xùn)練好的支持向量機(jī)SVM分類器,獲取所述目標(biāo)圖像的待識別字符,所述訓(xùn)練好的SVM分類器中保存有HOG特征描述子與字符的對應(yīng)關(guān)系。
根據(jù)本發(fā)明實施例的第二方面,提供一種字符識別的裝置,其特征在于,所述裝置應(yīng)用于對圖像中字符的識別,所述圖像中包括不確定位置的文本框,所述字符填寫在所述文本框中,所述裝置包括:
確定單元,用于確定文本框在待識別圖像中所處的位置;
截取單元,用于根據(jù)所述文本框的位置,截取所述待識別圖像中文本框?qū)?yīng)的目標(biāo)圖像;
計算單元,用于計算所述目標(biāo)圖像所對應(yīng)的目標(biāo)方向梯度直方圖HOG特征描述算子;
獲取單元,用于根據(jù)所述目標(biāo)HOG特征描述子以及預(yù)先訓(xùn)練好的支持向量機(jī)SVM分類器,獲取所述目標(biāo)圖像的待識別字符,所述訓(xùn)練好的SVM分類器中保存有HOG特征描述子與字符的對應(yīng)關(guān)系。
由以上技術(shù)方案可見,本發(fā)明實施例通過在所述待識別圖像中,確定所述文本框的位置,并根據(jù)所述文本框位置,截取所述待識別圖像中文本框?qū)?yīng)的目標(biāo)圖像,實現(xiàn)了對目標(biāo)圖像的主動定位和截取,避免了按照預(yù)設(shè)的固定坐標(biāo)截取目標(biāo)圖像區(qū)域所出現(xiàn)的偏差,提高了識別準(zhǔn)確率。
附圖說明
圖1為本發(fā)明字符識別的方法的一個實施例流程圖;
圖2為本發(fā)明字符識別的方法的另一個實施例流程圖;
圖3為本發(fā)明字符識別的裝置所在設(shè)備的一種硬件結(jié)構(gòu)圖;
圖4為本發(fā)明字符識別的裝置的一個實施例框圖。
具體實施方式
為了使本技術(shù)領(lǐng)域的人員更好的理解本發(fā)明實施例中的技術(shù)方案,并使本發(fā)明實施例的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖對本發(fā)明實施例中的技術(shù)方案作進(jìn)一步詳細(xì)的說明。
圖1為本發(fā)明字符識別的方法的一個實施例流程圖,所述方法應(yīng)用于對圖像中字符的識別,所述圖像中包括不確定位置的文本框,所述字符填寫在所述文本框中,所述方法包括以下步驟:
步驟101:確定文本框在待識別圖像中所處的位置。
在一個可選的方式中,可以將上述待識別圖像先做二值化處理,然后在所述二值化后的待識別圖像中確定所述文本框的坐標(biāo)。其中,對上述待識別圖像的二值化處理,可以是全局二值化處理,也可以是局部自適應(yīng)二值化處理。
步驟102:根據(jù)所述文本框的位置,截取所述待識別圖像中文本框?qū)?yīng)的目標(biāo)圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島偉東云教育集團(tuán)有限公司,未經(jīng)青島偉東云教育集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710193761.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





