[發明專利]一種圖像的處理方法和裝置有效
| 申請號: | 201410429608.6 | 申請日: | 2014-08-27 |
| 公開(公告)號: | CN104239853B | 公開(公告)日: | 2018-04-27 |
| 發明(設計)人: | 李健;蘭志才;張連毅;武衛東 | 申請(專利權)人: | 北京捷通華聲語音技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/54 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘭淑鐸 |
| 地址: | 100193 北京市海淀區東北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 處理 方法 裝置 | ||
技術領域
本申請涉及識別技術領域,特別是涉及一種圖像的處理方法和裝置。
背景技術
近年來,隨著業務的計算機化,使用了大量的電子文檔,由于這個原因,圖像識別技術作為將紙件文檔轉換為電子文檔的技術的重要性正在與日俱增。
在圖像識別時,由于用戶使用的拍攝設備的不同,所得到的圖像的大小就有可能不同,將得到的圖像進行識別時,無法準確的獲得圖像中的有效信息,并將圖像中的有效信息轉換成可編輯文字信息提供給使用者。同時,現有的拍圖器功能比較單一,只能識別和處理一種圖像,不能滿足用戶的實際需求。
發明內容
本申請提供一種圖像處理方法和裝置,以解決現有技術中在進行圖像識別時,無法準確的獲得圖像中的有效信息,并且識別功能單一的問題。
為了解決上述問題,本申請公開了一種圖像的處理方法,包括:獲取待識別的圖像,其中,所述待識別的圖像中包括字符圖像;將獲取的圖像進行切邊處理,得到包含所述字符圖像的、有效的待識別圖像范圍;將所述有效的待識別圖像范圍內的圖像進行預處理,獲得預處理后的所述字符圖像;使用多個識別引擎,對預處理后的所述字符圖像進行識別;當確定預處理后的所述字符圖像與所述多個識別引擎中的至少一個識別引擎的識別結果為可靠時,則輸出可靠的所述識別結果。
優選地,所述多個識別引擎包括:名片識別引擎、模板識別引擎和文本識別引擎中的至少二個;當所述多個識別引擎包括所述名片識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:
對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與名片識別引擎中的名片數據庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據比較結果對所述字符圖像進行識別,其中,所述字符圖像的第一閾值大于第二閾值;
當所述多個識別引擎包括所述文本識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與文本識別引擎中的文本數據庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據比較結果對所述字符圖像進行識別,其中,所述字符圖像的第三閾值大于第四閾值;
當所述多個識別引擎包括所述模板識別引擎時,所述使用多個識別引擎,對預處理后的所述字符圖像進行識別的步驟包括:
對預處理后的所述字符圖像進行分割,獲得多個單一字符,將每個單一字符與模板識別引擎中的模板數據庫進行匹配,得到每個單一字符的相似度的判定分值,將所述每個單一字符的相似度的判定分值求和,并對求和結果進行歸一化處理,將所述歸一化處理結果作為所述字符圖像的相似度的判定分值的平均值;將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第五閾值和第六閾值進行比較,根據比較結果對所述字符圖像進行識別,其中,所述字符圖像的第五閾值大于第六閾值。
優選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第一閾值和第二閾值進行比較,根據比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第一閾值時,則輸出可靠的所述識別結果;若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第二閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續調用未使用的識別引擎對預處理后的所述字符圖像進行識別。
優選地,將所述字符圖像的相似度的判定分值的平均值與預先設定的字符圖像的第三閾值和第四閾值進行比較,根據比較結果對所述字符圖像進行識別包括:若所述字符圖像的相似度的判定分值的平均值大于字符圖像的第三閾值時,則輸出可靠的所述識別結果;若所述字符圖像的相似度的判定分值的平均值小于字符圖像的第四閾值時,輸出不可靠的所述識別結果,在確定還有未使用的識別引擎時,繼續調用未使用的識別引擎對預處理后的所述字符圖像進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京捷通華聲語音技術有限公司,未經北京捷通華聲語音技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410429608.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





