[其他]采用筆劃近似直線的字符識別系統(tǒng)無效
| 申請?zhí)枺?/td> | 86100641 | 申請日: | 1986-01-22 |
| 公開(公告)號: | CN86100641A | 公開(公告)日: | 1986-10-01 |
| 發(fā)明(設(shè)計(jì))人: | 島隆紀(jì) | 申請(專利權(quán))人: | 國際商業(yè)機(jī)器公司(IBM) |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46 |
| 代理公司: | 上海專利事務(wù)所 | 代理人: | 全永留,徐株宏 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 采用 筆劃 近似 直線 字符 識別 系統(tǒng) | ||
本發(fā)明屬于字符識別領(lǐng)域,它涉及一種不需要使字符圖象的大小規(guī)范化和細(xì)線化的獨(dú)特方法的抽取筆劃近似直線的字符識別系統(tǒng)。
通常的抽取字符或筆劃黑體部分的字符識別技術(shù)需要事先對字符圖象的大小規(guī)范化和細(xì)線化。
因而,通常的技術(shù)有如下問題:
(1)在字符圖象的大小被規(guī)范化時(shí),可能會失去字符特征。
(2)在細(xì)線化處理時(shí),可能會引起襯線、短缺、或者會使交義點(diǎn)分離。
(3)通常的抽取幾何特征的字符識別,可識別的字符數(shù)至多幾十個(gè)。
本發(fā)明的目的是解決:
(1)不需要對字符的大小進(jìn)行規(guī)范化和細(xì)線化,就能充分獲得字符識別所必需的信息。
(2)增加讀出字符的準(zhǔn)確性,減少錯(cuò)誤識別率。
本發(fā)明獨(dú)特的抽取筆劃近似直線的方法是:
(a)當(dāng)檢測出在預(yù)定數(shù)或預(yù)定數(shù)以上相互間成橫間連接的象素在對被識別的字符讀出-掃描、量化和存儲的存儲器進(jìn)行掃描期間形成一個(gè)經(jīng)過二個(gè)或二個(gè)以上掃描線的縱向連接群體時(shí),所述群體連同以所述群體中最左面象素的X-Y座標(biāo)為始點(diǎn)信息和最右面象素的X-Y座標(biāo)為終點(diǎn)信息的橫向筆劃識別符號一起存儲進(jìn)存儲器內(nèi);(b)當(dāng)檢測出在預(yù)定數(shù)以下相互間成橫向連接的象素的縱向連接性形成一個(gè)縱向擴(kuò)展群體時(shí),所述群體連同以最上面掃描線內(nèi)象素群中點(diǎn)的X-y座標(biāo)為始點(diǎn)信息和最下面掃描線內(nèi)象素群中點(diǎn)的X-Y座標(biāo)為終點(diǎn)信息的縱向筆劃認(rèn)別符號一起存儲進(jìn)存儲器內(nèi);(c)當(dāng)檢測出在預(yù)定數(shù)或預(yù)定數(shù)以下相互間成橫向連接的象素縱向連接性形成一個(gè)顯示向右或向左傾斜趨勢的群體時(shí),所述群體連同以最上面掃描線內(nèi)象素群中點(diǎn)的X-Y座標(biāo)為始點(diǎn)信息和最下面掃描線內(nèi)象素群中點(diǎn)的X-Y座標(biāo)為終點(diǎn)信息的向右或向左傾斜的筆劃識別符號一起存儲進(jìn)存儲器內(nèi);這些群體可與事先被存儲進(jìn)去的被識別對象的基準(zhǔn)字符的候選字符表進(jìn)行比較。
根據(jù)本發(fā)明的字符識別系統(tǒng)是一種不需要對字符圖象的大小進(jìn)行規(guī)范化和細(xì)線化,而是用一次掃描耒檢測四個(gè)方向性和注重字符線寬度的方法耒抽取近似筆劃和特征的新的系統(tǒng),從而用較簡單的整理就能實(shí)現(xiàn)準(zhǔn)確度高、錯(cuò)誤識別率低的字符識別。
本發(fā)明的具體說明由以下的附圖及其實(shí)施例給出。
圖1(a)和(b)是根據(jù)掃描手寫體“0”和“5”后所存儲的象素和本發(fā)明的抽取出耒的筆劃近似直線圖。
11.……起始象素位置
12.……終止象素位置
13.……橫向筆劃
14.……縱向筆劃
15.……斜方向筆劃(向左斜)
16.……斜方向筆劃(向右斜)
17.……起始點(diǎn)
18.……終止點(diǎn)
19.……中點(diǎn)
圖2是使用本發(fā)明的字符識別系統(tǒng)的示意圖。
1.……筆劃抽取裝置
2.……字符識別前處理裝置
3.……字符識別裝置
4.……候選表
5.……存儲器
20.……掃描裝置
21.……量化裝置
22.……圖象存貯器
23.……字符讀出裝置
24.……字符識別處理裝置
25.……識別結(jié)果的輸出
圖3(a)、(b)和(c)是抽取手寫體字符的橫向筆劃的例子。
26.……掃描線的方向
圖4(a)-(e)是抽取手寫體字符的縱向筆劃的例子。
27.……中點(diǎn)右面的一個(gè)位置。
圖5(a)和(b)是抽取手寫字符的斜方向筆劃的例子。
圖6是處理擴(kuò)散點(diǎn)的例子
圖7是筆劃結(jié)合的例子
圖8是顯示橫向筆劃區(qū)域的圖。
圖9是顯示縱向斜方向筆劃區(qū)域的圖。
圖10是顯示字符識別處理的圖。
28.……根據(jù)筆劃數(shù)的候選選取表
29.……根據(jù)區(qū)域信息的候選選取表
30.……識別邏輯
31.……結(jié)果
32.……不能識別(排斥)
33.……無候選(排斥)
F……根據(jù)筆劃數(shù)十區(qū)域信息的所有候選
F……根據(jù)筆劃數(shù)十區(qū)域信息的所有候選(包括表2中的候選)
F……根據(jù)筆劃數(shù)的所有候選
圖11(a)和(b)是手寫片假名的象素和筆劃近似直線的例子。
圖12(a)和(b)是手寫字母的象素和筆劃近似直線的例子。
圖13(a)和(b)是手寫漢字的象素和筆劃近似直線的例子。
實(shí)施例
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國際商業(yè)機(jī)器公司(IBM),未經(jīng)國際商業(yè)機(jī)器公司(IBM)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/86100641/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





