[發明專利]OCR字符識別方法及系統有效

申請號：	201310752624.4	申請日：	2013-12-31
公開（公告）號：	CN103679165A	公開（公告）日：	2014-03-26
發明（設計）人：	王海峰;和為	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G06K9/20	分類號：	G06K9/20
代理公司：	北京清亦華知識產權代理事務所(普通合伙) 11201	代理人：	宋合成
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	ocr 字符識別方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及字符識別技術領域，特別涉及一種OCR字符識別方法及系統。

背景技術

目前很多翻譯APP產品都支持拍照翻譯功能，其操作步驟例如：用戶拿著移動終端（如智能手機）對著要翻譯的外文拍照，拍的照片被蒙上一層灰度；用戶用手指在蒙上灰度的照片上滑動，把想要翻譯的單詞“擦”出來；對用戶擦出的區域進行OCR識別，得到外文文本；調用機器翻譯模塊，對OCR結果進行翻譯，最后展現給用戶。

整個操作過程如圖1所示。但上述過程中有一個問題，用戶在“擦”單詞的時候，由于手指擋住了屏幕，經常會把左右或上下相鄰的單詞也一起“擦”到OCR范圍中。如上圖中所示，用戶本意想翻譯Obama這個單詞，但實際操作中左右各多劃出了幾個字母，導致OCR的結果是“it?Obama?I”，經過機器翻譯，得到的最終翻譯結果是“奧巴馬，我”。這樣的翻譯結果會對用戶造成困擾，影響用戶體驗。

發明內容

本發明的目的旨在至少解決所述技術缺陷之一。

為此，本發明的一個目的在于提出一種OCR字符識別方法。該方法可提升對OCR識別的結果的OCR翻譯的準確性。

本發明的另一個目的在于提出一種OCR字符識別系統。

為達到上述目的，本發明第一方面的實施例公開了一種OCR字符識別方法，包括以下步驟：對用戶選擇的目標區域內的圖像進行OCR字符識別以得到識別的詞串，其中，所述詞串包括K個子詞串，每個子詞串至少包括1個字符，所述K為正整數；計算所述識別的詞串中子詞串的數量；如果所述詞串中子詞串的數量大于2，則判斷所述第1個子詞串W₁中字符的個數和所述第K個子詞串W_K中字符的個數是否小于預設值；如果所述W₁中字符的個數和/或W_K中字符的個數小于所述預設值，則判斷所述W₁的噪聲概率得分和/或W_K的噪聲概率得分是否大于預設噪音；如果是，則判定所述W₁和/或所述W_K為噪聲并從所述詞串中刪除所述W₁和/或所述W_K以得到新的詞串。

根據本發明實施例的OCR字符識別方法，針對OCR翻譯中OCR識別的結果進行降噪處理，由此，可識別并刪除通常由于用戶誤操作帶來的OCR噪聲。這樣，在去噪之后，可提升和凈化翻譯結果，使翻譯結果更加準確，提高用戶體驗。

另外，根據本發明上述實施例的OCR字符識別方法還可以具有如下附加的技術特征：

在一些示例中，還包括：如果所述詞串中子詞串的數量等于2，則判斷所述W₁中字符的個數是否小于所述W_K中字符的個數；如果所述W₁中字符的個數小于所述W_K中字符的個數，則進一步判斷所述W₁中字符的個數是否小于預設值；如果所述W₁中字符的個數小于所述預設值，則進一步判斷所述W₁的噪聲概率得分是否大于預設噪音；如果是，則判定所述W₁為噪聲并從所述詞串中刪除所述W₁以得到新的詞串。

在一些示例中，還包括：如果所述W₁中字符的個數大于所述W_K中字符的個數，則進一步判斷所述W_K中字符的個數是否小于預設值；如果所述W_K中字符的個數小于所述預設值，則進一步判斷所述W_K的噪聲概率得分是否大于預設噪音；如果是，則判定所述W_K為噪聲并從所述詞串中刪除所述W_K以得到新的詞串。

在一些示例中，所述噪聲通過如下公式得到：

P_left＝αlogp(W₁)+βlogp(W₂|W₁)，

P_right＝αlogp(W_k)+βlogp(W_k|W_k-1)。

在一些示例中，還包括：對所述新的詞串進行OCR翻譯。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司，未經北京百度網訊科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310752624.4/2.html，轉載請聲明來源鉆瓜專利網。