[發明專利]手寫粘連數字串的識別方法在審
| 申請號: | 201410749989.6 | 申請日: | 2015-08-04 |
| 公開(公告)號: | CN104504385A | 公開(公告)日: | 2015-07-29 |
| 發明(設計)人: | 高新聞;管奔博;俞黎卿 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/54 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 手寫 粘連 字串 識別 方法 | ||
技術領域
本發明屬于手寫體數字串的識別方法,特別是一種手寫粘連數字串的識別方法。
背景技術
光學字符識別(OCR)技術已經成為人們錄入文字信息的關鍵技術,一個OCR系統可以實現將影像中的文字信息轉化成相應的計算機文字,大大減少了影像資料的存儲空間。同時,提取出的計算機文字信息可以直接用于分析、傳輸、處理等。因此,OCR技術在各個領域都得到了廣泛的應用。現有的OCR技術中,單個手寫數字的識別已經廣泛使用。但是,這些OCR技術都是基于單個字符的逐個識別,其識別效率太低,不能滿足對字符串識別的要求,尤其是字符串粘連時,其識別率就更低。
中國專利2012100769575公開了一種連筆手寫字符的識別方法,該方法包括下述步驟:(1)對輸入圖像進行降噪處理,消除數字噪聲;(2)通過基于邊緣的字數估計算法計算字數;(3)通過最小代價切分算法計算最佳字符分割方案;(4)通過基于筆畫的筆跡跟蹤算法確定是否存在需要再切分的塊,如果存在需要再切分的塊,則返回步驟(2)重新計算、分割;如果不存在,則進行下一步驟;(5)對分割后的字符圖像進行OCR識別,轉化為計算機文字。該方法能夠實現連筆字符的精確分割,提高對連筆字符識別的正確率。但是,該方法僅能夠對粘連較少的數字串進行識別,對于粘連較大的數字串的識別,還不能滿足實際要求。而且,對于手寫粘連數字串識別的通用性差,只能對于一些特定的粘連情況有好的效果。
發明內容
本發明的目的在于克服現有技術中存在的缺陷,提供一種手寫粘連數字串的識別方法。
為達到上述目的,本發明采用如下技術方案:
一種手寫粘連數字串的識別方法,其特征在于包括以下步驟:
a.?聯機手寫輸入數字串,獲取該數字串的筆畫數目m、每個筆畫所對應的軌跡坐標和該數字串的圖像;
b.?根據步驟a所得的每個筆畫所對應的軌跡坐標,計算每個筆畫各自的中心橫坐標,得到這m個筆畫的中心橫坐標數組avgX[i],i=1,……,m;
c.?將步驟a所得數字串的圖像進行初次分割,得到M個初分割區域,并記錄該M個初分割區域的左右邊界值(Lx[j],Rx[j]),j=1,……,M;
d.?將m個筆畫所對應的軌跡坐標的中心橫坐標avgX[i],i=1,……,m與M個初分割區域的左右邊界值(Lx[j],Rx[j]),j=1,……,M進行對比,若Lx[j]<avgX[i]<Rx[j],則將第i個筆畫劃歸為初分割區域j,得到數組count[j],j=1,……,M,其中count[j]的值表示第j個初分割區域中包含的筆畫個數;得到筆畫數組V[j][count[j]],保存第j個初分割區域對應不同筆畫i的數值;
e.讀取步驟d所得數組V[j][count[j]]?,j=1,……,M,判斷第j個初分割區域中的筆畫個數count[j]是否為1,若是則轉入步驟h;否則轉入步驟f;
f.?若第j個初分割區域的筆畫個數count[j]>1,且該初分割區域的寬高比小于1,即初分割區域的寬度與初分割區域高度的比值小于1,若是則轉入步驟h;否則轉入步驟g;
g.?數字串的分段識別:讀取前2個筆畫,采用神經網絡算法進行識別,若成功識別則刪除這2個筆畫,返回識別結果;若不能識別,則讀取前1個筆畫,采用神經網絡算法進行識別,并刪除這個已識別的筆畫,同時返回識別結果,重復步驟g直至該初分割區域的筆畫全部識別完畢,轉入步驟i;
h.?采用神經網絡算法進行識別,并返回識別結果;
i.?讀取筆畫數組中的下一個數值V[j+1][count[j+1]],重復步驟e;直至筆畫數組中的所有數值均處理完畢;
j.?返回最終識別結果,得到手寫粘連數字串所表示的數值。
上述的步驟a的具體步驟為:
a-1.?檢測手寫數字之間的提筆和落筆,記錄字符串的筆畫數目m;
a-2.?獲取m個筆畫相對應的軌跡坐標:筆畫的軌跡坐標用(Xn,Yn)點坐標序列表示:(X1,Y1),(X2,Y2),…,(Xn,Yn),其中n是筆畫的采樣點數。
a-3.?得到軌跡坐標數組Datapoint[m][n],m就是字符串的筆畫數目;Datapoint[i][n]保存第i個筆畫的軌跡坐標,i=1,2,3…,m。
上述的步驟c的具體步驟為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410749989.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文本圖像的校正方法和裝置
- 下一篇:基于卷積神經網絡的人臉檢測方法





