[發明專利]圖像處理方法和裝置在審
| 申請號: | 201310101523.0 | 申請日: | 2013-03-27 |
| 公開(公告)號: | CN104077593A | 公開(公告)日: | 2014-10-01 |
| 發明(設計)人: | 汪留安;孫俊;何源;范偉;勝山裕;堀田悅伸 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 朱勝;陳煒 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 裝置 | ||
技術領域
本申請一般涉及圖像處理,更具體地,涉及對圖像進行光學字符識別(OCR)的方法和裝置。
背景技術
OCR被廣泛應用于識別圖像中的字符。通常,OCR被設計為對單一字符集或語種的字符進行識別,當識別對象為文字和某些符號的混合的情況下,一般的OCR方法可能難以得到令人滿意的識別準確度。這些文字和符號混合的情況例如包括統一資源定位符(URL)、電子郵件地址、數學公式、程序代碼等。相應地,針對特定識別對象的特點,存在對識別結果進行糾錯以改善識別準確度的方法。例如,存在根據具體識別對象所具有的特定語法規則或基于歷史信息來對識別結果進行糾錯的方法。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖確定本發明的關鍵或重要部分,也不是意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
根據本申請的一個方面,一種圖像處理方法包括:在圖像的文本區域中識別預定符號;從文本區域中去除與識別出的預定符號相對應的部分;對去除了該相對應的部分的文本區域執行光學字符識別;以及將識別出的預定符號添加到光學字符識別的結果中的相應位置。
根據本申請的另一個方面,一種圖像處理裝置包括:符號識別部分,被配置為在圖像的文本區域中識別預定符號;符號去除部分,被配置為從文本區域中去除與識別出的預定符號相對應的部分;光學字符識別部分,被配置為對去除了該相對應的部分的文本區域執行光學字符識別;以及符號添加部分,被配置為將識別出的預定符號添加到光學字符識別的結果中的相應位置。
附圖說明
本發明可以通過參考下文中結合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標記來表示相同或者相似的部件。所述附圖連同下面的詳細說明一起包含在本說明書中并且形成本說明書的一部分,而且用來進一步舉例說明本發明的優選實施例和解釋本發明的原理和優點。在附圖中:
圖1是示出根據本申請實施例的圖像處理方法的過程示例的流程圖;
圖2是用于說明根據本申請實施例的圖像處理方法對反斜杠符號進行識別的示意圖;
圖3是示出根據本申請另一個實施例的圖像處理方法的過程示例的流程圖;
圖4是示出用于識別URL的子過程示例的流程圖;
圖5是示出用于識別URL的子過程示例的流程圖;
圖6是示出用于識別URL的子過程示例的流程圖;
圖7是示出用于識別URL的子過程示例的流程圖;
圖8是示出根據本申請實施例的圖像處理裝置的配置示例的框圖;
圖9是示出符號識別部分的配置示例的框圖;
圖10是示出根據本申請另一個實施例的圖像處理裝置的配置示例的框圖;
圖11是示出URL識別部分的配置示例的框圖;
圖12是示出URL識別部分的配置示例的框圖;
圖13是示出URL識別部分的配置示例的框圖;
圖14是示出URL識別部分的配置示例的框圖;以及
圖15是示出實現本申請的方法和設備的計算機的示例性結構的框圖。
具體實施方式
下面將參照附圖來說明本發明的實施例。在本發明的一個附圖或一種實施方式中描述的元素和特征可以與一個或更多個其它附圖或實施方式中示出的元素和特征相結合。應當注意,為了清楚的目的,附圖和說明中省略了與本發明無關的、本領域普通技術人員已知的部件和處理的表示和描述。
首先參照圖1描述根據本申請實施例的圖像處理方法的過程示例。
作為本申請實施例的圖像處理方法的處理對象可以是靜態圖像(例如網絡圖片或用戶拍攝的圖像等),或者可以是視頻(例如電視、網絡視頻等)的幀,但不限于此。另外,圖像可以包括彩色圖像、灰度圖像、二值圖像等,但不限于此。在必要時,可以通過本領域已知的多種方法對圖像進行顏色、分辨率等方面的調整或轉換,以滿足相應光學字符識別方式的要求。另外,可以通過多種已有的方式識別圖像中的文本區域,在此不再贅述。
如圖1所示,在步驟S110,在圖像的文字區域中識別預定符號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310101523.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





