[發(fā)明專利]一種易混字符二次識別方法有效
| 申請?zhí)枺?/td> | 202010184590.3 | 申請日: | 2020-03-17 |
| 公開(公告)號: | CN111340033B | 公開(公告)日: | 2023-05-02 |
| 發(fā)明(設(shè)計)人: | 付鵬斌;彭荊旋;楊惠榮 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/18;G06V10/82;G06V30/22 |
| 代理公司: | 北京思海天達知識產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 吳蔭芳 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 字符 二次 識別 方法 | ||
本發(fā)明涉及一種易混字符二次識別方法,用于提高手寫字符識別率。對易混字符圖像進行細化操作,生成固定大小的目標(biāo)圖像;定義易混字符對“1”、“(”、“)”的直線特征、斜率特征、曲率特征,提取目標(biāo)圖像的特征向量,基于SVM分類器識別分類;定義易混字符對“1”、“9”的孔洞特征,設(shè)計基于孔洞特征的分類算法,實現(xiàn)“1”、“9”的二次識別;定義易混字符對“4”、“6”的交截點相對位置特征,設(shè)計基于交截點相對位置特征的分類算法,實現(xiàn)“4”、“6”的二次識別;定義易混字符對“7”、“”的夾角特征、方向角特征、連續(xù)豎直點個數(shù)特征,提取目標(biāo)圖像的特征向量,基于SVM分類器識別分類;本發(fā)明可有效提高數(shù)學(xué)字符的平均識別率。
技術(shù)領(lǐng)域
本發(fā)明涉及機器學(xué)習(xí)、手寫體識別、特征提取領(lǐng)域,具體涉及一種易混字符二次識別方法。
背景技術(shù)
目前的脫機手寫識別技術(shù)可以實現(xiàn)簡易的數(shù)學(xué)公式的判別,但對于一些具有復(fù)雜空間組合及包含關(guān)系的手寫公式,不能有效地識別。有研究者提出了一種基于編碼-解碼器框架的新型多模態(tài)注意網(wǎng)絡(luò),用于手寫數(shù)學(xué)公式識別,該方法在CROHME?2014和CROHME2016數(shù)據(jù)庫上達到了54.05%和50.56%的識別準(zhǔn)確率。有研究者實現(xiàn)了一款基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)分類算法的脫機手寫公式識別系統(tǒng),實驗結(jié)果顯示,該系統(tǒng)的公式識別準(zhǔn)確率為80%。通過分析發(fā)現(xiàn),造成以上研究識別率較低的主要原因在于,數(shù)學(xué)公式中包含數(shù)字、運算符號和字母等,極易出現(xiàn)一些結(jié)構(gòu)特征相似的字符,導(dǎo)致識別率的降低。
基于CNN分類算法對常見的20類數(shù)學(xué)字符進行識別,統(tǒng)計字符識別率,如圖1所示,并找到了四組易混字符對:第一組“1”、“(”、“)”,見圖2a)-2c);第二組“1”、“9”,見圖3a)-3b);第三組“4”、“6”,見圖4a)-4b);第四組“7”、“”,見圖5a)-5b)。因此,如何提高這四組易混字符對的識別率成為了脫機手寫識別技術(shù)的關(guān)鍵。
發(fā)明內(nèi)容
本發(fā)明針對上述四組易混字符對提出了一種基于特征提取的二次識別的解決方案。
實現(xiàn)本發(fā)明方法的主要步驟如下:對易混字符圖像(見圖6a))進行細化操作,生成固定大小的目標(biāo)圖像(見圖6b));定義易混字符對“1”、“(”、“)”的直線特征、斜率特征、曲率特征,提取目標(biāo)圖像的特征向量,基于SVM分類器識別分類;定義易混字符對“1”、“9”的孔洞特征,設(shè)計基于孔洞特征的分類算法,實現(xiàn)“1”、“9”的二次識別;定義易混字符對“4”、“6”的交截點相對位置特征,設(shè)計基于交截點相對位置特征的分類算法,實現(xiàn)“4”、“6”的二次識別;定義易混字符對“7”、“”的夾角特征、方向角特征、連續(xù)豎直點個數(shù)特征,提取目標(biāo)圖像的特征向量,基于SVM分類器識別分類;本發(fā)明可有效提高數(shù)學(xué)字符的平均識別率。
一種易混字符二次識別方法,包括如下步驟:
所述易混字符對“1”、“(”、“)”的二次識別方法為:提取目標(biāo)圖像的特征向量,生成易混字符對數(shù)據(jù)集,所述特征向量包括:“1”、“(”、“)”的直線特征、斜率特征、曲率特征;利用數(shù)據(jù)集訓(xùn)練分類模型,利用訓(xùn)練完成的分類器對待識別字符進行二次分類;
所述易混字符對“1”、“9”的二次識別方法為:判斷目標(biāo)圖像是否存在孔洞特征,如果存在,則目標(biāo)圖像識別為9,否則,目標(biāo)圖像識別為1;
所述易混字符對“4”、“6”的二次識別方法為:判斷目標(biāo)圖像交截點相對位置偏上還是偏下,如果偏上,且目標(biāo)圖像中孔洞特征的最低點不與目標(biāo)圖像最低點重合,則目標(biāo)圖像識別為4,否則,目標(biāo)圖像識別為6;
所述易混字符對“7”、“”的二次識別方法為:提取目標(biāo)圖像的特征向量,生成易混字符對數(shù)據(jù)集,所述特征向量包括:“7”、“”的夾角特征、方向角特征、連續(xù)豎直點個數(shù)特征;利用數(shù)據(jù)集訓(xùn)練分類模型,利用訓(xùn)練完成的分類器對待識別字符進行二次分類。
有益效果
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010184590.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





