[發明專利]用于切分具有不同字符寬度的文本行中的字符的方法和系統有效
| 申請號: | 201110352060.6 | 申請日: | 2011-11-09 |
| 公開(公告)號: | CN103106406A | 公開(公告)日: | 2013-05-15 |
| 發明(設計)人: | 羅兆海;李獻 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 付建軍 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 切分 具有 不同 字符 寬度 文本 中的 方法 系統 | ||
技術領域
本發明涉及光學字符識別,更具體地說,涉及一種用于切分具有不同字符寬度的文本行中的字符的方法和系統。
背景技術
在光學字符識別(Optical?Character?Recognition,OCR)系統中,通常,如圖3中的流程圖所示執行OCR處理。首先,輸入通過掃描儀或照相機或者通過其它裝置獲取的文檔圖像。該包括多個文本行的文檔圖像然后被分割成文本行圖像。對于每個文本行圖像,對該文本行中的字符執行字符切分。之后,基于字符切分的結果,執行字符識別以產生識別結果。
通常,在字符切分步驟中,首先基于黑像素投影把文本行圖像切分成字符。根據字符寬度、字符高度和行高度等的統計信息,計算平均字符寬度(average?character?width,ACW)??蛇x地,此時,可以執行根據連通域方法的字符切分。當切出字符的寬度大于平均字符寬度時,將根據平均字符寬度或者根據如在日本專利申請公報JP05-128307中公開的邊界跟蹤方法對其進行強制切分(force-split)。然后,通過根據平均字符寬度創建不同的切分模式(路徑),把字符的片段(fragments)進行組合。最后,識別所有模式下的字符,并將不同切分模式下的最佳切分結果選擇作為字符切分的結果。
在該流程中,平均字符寬度是判斷一個字符區域是包括一些實際字符還是只包括一個字符的部分或者多個字符的部分的非常重要的標準。在切分字符或者創建合理的切分模式的過程中,平均字符寬度也是重要的判斷條件。
然而,本發明的發明人發現,當文檔圖像中的文本行由具有彼此不同的寬度的字符構成時,看起來有時候一個均一的平均字符寬度無法適合于該文本行中的所有字符。如果平均字符寬度適合于“寬”字符,則一些連通的字符可能不會被正確切分,或者一些字符會被錯誤地組合為一個字符?!皩挕钡钠骄址麑挾冗€會導致更多的可能的切分模式,這涉及了更多的計算時間或復雜性。如果平均字符寬度僅僅適合于“窄”字符,則一些“寬”字符將被錯誤地切分成片段。這兩種情況都將降低OCR精度。
圖4A和圖4B中例示了說明現有技術中存在的缺陷的一些例子。
在圖4A中,文本行同時包括一些全寬字符和一些半寬字符(例如,字母、數字或者全寬字符的左或右偏旁)。當使用均一的平均字符寬度來切分字符時,在圖4A中示出了字符切分的結果。在該現有技術的例子中,發生了一些字符切分錯誤,例如,日本漢字“特開”被錯誤地切分為片段。
在圖4B中,示出了使用現有技術的字符切分結果。即使對于相同的字體和字號,以日語作為例子,一些假名的寬度也不同于其它假名和/或日本漢字的寬度。例如,具有不同寬度的假名“れる”(在圖4B的第二行中)被錯誤地切分。
另外,由于在文本行中存在一些連通的字符,所以難以僅僅基于平均字符寬度找到最佳切分結果。例如,圖4B中的假名“バイ”(在第一行中)和“た?!?在第三行中)是連通字符的例子,從而根據現有技術被錯誤地切分。
因此,需要一種能夠切分包括全寬字符和半寬字符或者包括具有不同字符寬度的假名和日本漢字的文本行中的字符從而提高OCR精度的技術。還需要一種能夠切分具有連通域的字符的技術。
發明內容
考慮到前述的現有技術中存在的多個技術問題,提供了一種用于切分具有不同字符寬度的文本行中的字符的新的方法和系統。
根據本發明的一個方面,提供了一種用于切分具有不同字符寬度的文本行中的字符的方法,包括以下步驟:
第一切分步驟,根據基于投影的方法將所述文本行切分為第一字符集合;
計算步驟,基于所述第一字符集合計算平均字符寬度;
強制切分步驟,基于計算的平均字符寬度,對所述第一字符集合中的寬字符進行強制切分,以獲得第二字符集合;
設置步驟,針對所述第二字符集合中的不同字符設置不同的平均字符寬度;以及
組合步驟,通過根據所設置的不同的平均字符寬度創建不同的切分模式并且選擇最佳切分模式,對所述第二字符集合中的字符進行組合。
根據本發明的另一方面,提供了一種用于切分具有不同字符寬度的文本行中的字符的系統,包括:
第一切分單元,被配置為根據基于投影的方法將所述文本行切分為第一字符集合;
計算單元,被配置為基于所述第一字符集合計算平均字符寬度;
強制切分單元,被配置為基于計算的平均字符寬度,對所述第一字符集合中的寬字符進行強制切分,以獲得第二字符集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110352060.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電力系統負荷恢復輔助決策系統及其決策生成方法
- 下一篇:混凝土骨料預濕設備





