[發明專利]字典創建裝置、識別裝置及識別方法有效
| 申請號: | 200910138419.2 | 申請日: | 2009-05-11 |
| 公開(公告)號: | CN101582118A | 公開(公告)日: | 2009-11-18 |
| 發明(設計)人: | 堀田悅伸;藤本克仁 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/64 | 分類號: | G06K9/64 |
| 代理公司: | 北京集佳知識產權代理有限公司 | 代理人: | 陳 煒;李春暉 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字典 創建 裝置 識別 方法 | ||
技術領域
這里所討論的實施例旨在提出一種字典創建裝置、識別裝置及識別方法。?
背景技術
近來,隨著裝有攝像頭的移動終端(下文中的“拍照電話”)的廣泛使用,對由攝像頭所拍攝的圖像中的字符或字母進行識別或翻譯、或者基于字符識別的輸入結果來對信息進行檢索的需求增加。?
為了滿足這種需求,拍照電話中通常裝有光學字符讀取器(OCR)。?
同時,重要的是,帶有OCR的移動終端應當具有便攜性。因此,與諸如個人計算機(PC)的固定終端不同的是,必須減小存儲器的印刷電路板及中央處理單元(CPU)的尺寸以減小移動終端的尺寸。相應的是,在安裝OCR時,硬件性能受到限制。?
因為這種限制,在用于移動終端的OCR中使用簡單的字符識別系統。通常,在示例性字符識別系統中,存儲每個字符的平均向量,并計算作為識別對象的所輸入的字符的特征向量與存儲在字符識別字典中的、每個字符的平均向量之間的距離。然后,將其平均向量與所輸入的字符的特征向量的距離最小的字符視為識別結果(例如,參見日本特開平第05-46812號公報)。?
然而,日本特開平第05-46812號公報中的字符識別系統固有的字符識別準確度有限。?
即,作為識別對象的所輸入的字符的字體不一定是固定類型的字體之一。盡管能夠以一定的準確度對預先學習過的字體進行識別,但是在輸入未經學習的字體時,不能達到令人滿意的字符識別準確度。?
為了實現高準確度的字符識別,除了字符的平均向量之外,還可以使用由協方差矩陣所定義的本征值及本征向量來進行字符識別。在這種情況下,需要其中存儲有每個字符的本征值及本征向量的字符識別字典。該字?典的量變得非常大,因此該字典難以安裝在移動終端中。?
尤其是,在字符為漢字時,要被登記在字典中的字符的總數約為4000,因而將這么多字符的本征值及本征向量登記在用于移動終端的OCR的字典中是不可行的。?
由于這個原因,在移動終端中裝有字符識別裝置時,如何在實現高準確度的字符識別能力的同時減小字典的量成為問題。對于進行使用類別概率分布的模式識別(例如,人臉圖像識別)的情況以及進行作為模式識別的字符識別的情況,這個問題是很普遍的。?
發明內容
本發明的目的是至少部分地解決傳統技術中的問題。?
根據實施例的一方面,字典創建裝置包括:特征量計算單元,其基于用于創建模式識別字典的訓練數據來計算作為識別項的、每個類別的特征量;分布輪廓計算單元,其基于由所述特征量計算單元所計算出的、每個類別的所述特征量來計算每個類別的所述特征量的組的分布輪廓;距離計算單元,其基于由所述分布輪廓計算單元所計算出的、每個類別的所述特征量的所述組的所述分布輪廓來計算各自的類別的所述分布輪廓之間的距離;聚類對象確定單元,其基于由所述距離計算單元所計算出的、各自的類別的所述分布輪廓之間的所述距離來確定作為聚類對象的分布輪廓;典型分布輪廓確定單元,其確定代表由所述聚類對象確定單元所確定的所述聚類對象的所述分布輪廓的典型分布輪廓;聚類單元,其將被所述聚類對象確定單元確定為所述聚類對象的所述分布輪廓聚類;關聯單元,其將由所述典型分布輪廓確定單元所確定的所述典型分布輪廓與在所述聚類單元所進行的所述聚類之后作為元素被包含在所述典型分布輪廓中的類別相關聯;以及字典登記單元,其將被所述關聯單元彼此關聯起來的所述典型分布輪廓及所述類別登記在預定字典存儲單元中。?
將通過在權利請求書中具體地指出的元素及組合來實現并獲得本發明的目的及優點。?
應當理解,上文的概括說明及下文的詳細說明都是示例性和解釋性的,而并非對所要求保護的本發明的限制。?
附圖說明
圖1是用于解釋由根據本發明第一實施例的字典創建裝置所進行的聚類的概念的示意圖;?
圖2是根據第一實施例的字典創建裝置及字符識別裝置的結構的功能框圖;?
圖3是根據第一實施例的字典創建處理過程的流程圖;?
圖4是用于解釋關聯單元的處理內容的示意圖;?
圖5是根據第一實施例的字符識別處理過程的流程圖;?
圖6是根據本發明第二實施例的字典創建裝置及字符識別裝置的結構的功能框圖;?
圖7是用于解釋與讀取錯誤具有對應關系的字符類別的示意圖;?
圖8是存儲在讀取錯誤對應存儲單元中的信息的結構示例;以及?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910138419.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:通信裝置、通信方法、通信系統和服務發布方法
- 下一篇:便捷餐具





