[發明專利]字符識別設備和字符識別方法在審
| 申請號: | 201110271956.1 | 申請日: | 2011-09-09 |
| 公開(公告)號: | CN102646201A | 公開(公告)日: | 2012-08-22 |
| 發明(設計)人: | 織田英人 | 申請(專利權)人: | 富士施樂株式會社 |
| 主分類號: | G06K9/68 | 分類號: | G06K9/68 |
| 代理公司: | 北京天昊聯合知識產權代理有限公司 11112 | 代理人: | 陳源;張天舒 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 設備 方法 | ||
技術領域
本發明涉及字符識別設備和字符識別方法。
背景技術
用于將手寫字符轉換成為文本數據的字符識別技術已經是可利用的。例如,日本未審查專利申請公開No.6-76098描述了這樣一種技術,其用于將填充兩個相鄰字符框的字符和附加到該字符的“dakuten”(或濁音標志)或者“handakuten”(或半濁音標志)轉換成為帶有濁音標志或半濁音標志的單一的復合字符。日本未審查專利申請公開No.5-12245描述了這樣一種技術,其用于確定所輸入的手寫字符是大寫字母還是小寫字母。日本未審查專利申請公開No.7-262314描述了這樣一種技術,其用于精確地識別“dakuten”(或濁音標志)或者“handakuten”(或半濁音標志)。日本未審查專利申請公開No.9-231316描述了這樣一種技術,其用于顯示具有相同形狀但具有不同大小的字符作為識別候選。
發明內容
因此,本發明的一個目的在于提供精確的字符串識別,即使該字符串包括復合字符。
根據本發明的第一方面,提供了一種字符識別設備,該設備包括獲取單元、指定單元、移動單元以及識別單元。獲取單元獲取表示字符串的數據。指定單元指定滿足預定條件的復合字符的元素,所述預定條件用于從字符串確定該復合字符。移動單元將所述復合字符的元素移動靠近相鄰字符。識別單元根據字符的形狀和相鄰字符之間的相關性來識別改變后字符串,其中在改變后字符串中,移動單元已經對該復合字符的元素進行了移動。
根據本發明的第二方面,根據本發明第一方面的字符識別設備還包括存儲器,其存儲表明跟隨在第一字符之后的第二字符出現可能性的值。識別單元通過根據字符的形狀指定第二字符的多個候選,并且通過根據存儲在存儲器中的值從各個候選中選擇具有最高出現可能性的字符來識別改變后字符串。
根據本發明的第三方面,在根據本發明第二方面的字符識別設備中還包括整合單元,其對分離的區域進行整合。字符串被寫在多個分離的區域中。整合單元對寫入了被移動的復合字符的元素的區域和寫入了相鄰字符的區域進行整合。當要被識別的字符寫在沒有被整合單元整合的區域中時,識別單元根據該要被識別的字符的形狀來指定識別候選作為單一字符,而當要被識別的字符寫在被整合單元整合的區域中時,識別單元根據該要被識別的字符的形狀來指定識別候選作為單個字符或作為多個字符。
根據本發明的第四方面,在根據本發明的第一至第三任一方面的字符識別設備中,復合字符的元素是變音標志(diacritical?mark),并且移動單元將變音標志移動至靠近相鄰字符。
根據本發明的第五方面,在根據本發明的第一或第四方面的字符識別設備中,預定條件包括字符的位置和字符筆劃數。
根據本發明的第六方面,在根據本發明的第一方面的字符識別設備中,移動單元沿水平方向或者在垂直方向中將復合字符的元素移動至靠近相鄰字符。
根據本發明的第七方面,在根據本發明的第一方面的字符識別設備中,獲取單元從圖像數據獲取表示字符串的數據。
根據本發明的第八方面,在根據本發明的第七方面的字符識別設備中,圖像數據包括筆跡數據。
根據本發明的第九方面,提供一種字符識別方法,該方法包括:獲取表示字符串的數據;指定滿足預定條件的復合字符的元素,所述預定條件用于從字符串確定該復合字符;將所述復合字符的元素移動至靠近相鄰的字符;以及根據字符的形狀和相鄰字符之間的相關性識別改變后的字符串,其中在改變后的字符串中,已經對復合字符元素進行了移動。
根據發明的第一方面,即使字符串包括復合字符,與不對字符進行移動而對字符串進行識別的情況相比,可以更精確地對字符串進行識別。
根據發明的第二方面,與不使用存儲在存儲器中的值來識別字符的情況相比,可以獲得更高的字符串識別精度。
根據發明的第三方面,與對被指定作為識別候選的字符的筆劃數沒有限制的情況相比,可以獲得更高的字符串識別精度。
根據發明的第四方面,可以識別具有諸如“dakuten”(或濁音標志)或者“handakuten”(或半濁音標志)之類的變音標志以及任何其他元素的復合字符。
根據發明的第五方面,與使用除了字符的位置和字符筆劃數以外的任何條件的情況相比,可以減少用于指定滿足用于確定諸如“dakuten”(或濁音標志)或者“handakuten”(或半濁音標志)之類的變音標志的預定條件的字符的處理所需的時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士施樂株式會社,未經富士施樂株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110271956.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:料盒提取設備
- 下一篇:一種分布式集群系統及其實現方法





