[發明專利]用于圖像文字識別的特征圖片自動生成系統在審
| 申請號: | 201611250766.0 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN106778759A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 韓遠;景亮;劉世林;康青楊;唐涔軒 | 申請(專利權)人: | 成都數聯銘品科技有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06K9/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610041 四川省成都市高新區*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 圖像 文字 識別 特征 圖片 自動 生成 系統 | ||
技術領域
本發明圖像識別領域,特別涉及用于圖像文字識別的特征圖片自動生成系統。
背景技術
隨著社會的發展和科技的進步,人類創造的知識正以指數級的數量增加,在電子書籍出現之前,大部分的知識是以圖書的方式進行傳承,中華上下五千年,產生了大量優秀書籍,這些書籍在歷史的長河中,或多或少都遭到了不同程度的損壞,因此對這些書籍進行數字化存儲迫在眉睫;在圖書管理領域,書籍內容的快速搜索對于快速定位書籍很有幫助,而由于書籍數量太多,加上早期印刷的圖書沒有作者的電子文稿,因此紙質書籍的電子化很有必要。
光學字符識別軟件就是處理這種紙質圖書到電子文檔轉化的利器,其主要利用大量的字符樣本,經過復雜網絡的學習,生成相應的模型文件,從而達到識別圖片中字符的目的。
光學字符識別軟件主要功能是識別拍攝、掃描圖片中的字符,現有技術中在進行圖像中文字的識別時,首先需要將圖像中的字符串切分開,形成包含單個文字的小圖片,然后使用一定的方法對切分后的文字進行識別。而進行文字切分最常用的方法為投影法,即是將圖像文字二值化處理后,通過垂直投影法找到兩個文字之間的分界線,根據分界線將文字切分開來。然而當圖像中的文字之間具有粘連,且圖像中包含左右結構的漢字時,簡單的投影方法就很難實現較好的切分效果;正是因為這個原因使得切分一直是OCR識別的難點,切分的質量將直接影響到文字的識別效果。
此外光學字符識別軟件主要功能是識別拍攝、掃描圖片中的字符,對于一些特殊字體的掃描件,公章,拍照,比如早期印刷的書籍,政府單位制作的證件等,由于歷史原因以及保密與安全需要,其字體往往是特制的,現有的光學字符識別軟件主要集中于機器學習的方法,模型運算量大,而且由于訓練字體樣本沒有覆蓋到特殊字體,導致特殊字體的識別準確率不高,嚴重影響紙質文檔的電子化。
現有技術大多采用神經網絡機器學習算法對字符進行識別,需要制作大量的樣本,耗費大量的時間進行訓練,且生成的模型文件非常龐大,且對于不同字體的字符,識別率不盡相同,對于某些特殊字體字符,識別率比較低,很難滿足一些特殊場景下的字符識別。
發明內容
本發明的目的在于克服現有技術中所存在的上述不足,提供用于圖像文字識別的特征圖片自動生成系統,在對待識別圖像文字進行有效切分的基礎上,根據用戶選擇的字體自動生成特征圖片,為實現特殊字體OCR識別準備條件。
為了實現上述發明目的,本發明提供了以下技術方案:用于圖像文字識別的特征圖片自動生成系統,包含圖像文字切分模塊、特征圖片生成模塊和存儲模塊,所述圖像文字切分模塊采用投影法將待識別切分成僅包含單個字符的子圖片,并將中的數字、字母和標點符號標記出來,存儲于存儲模塊中;
所述特征圖片生成模塊,根據用戶在每個數字、字母和標點對應的子圖片中選擇的一張子圖片,將子圖中的字符,分別向上、下、左、右、左上、左下、右上和右下移動設定距離l,制成對應的特征圖片,并對制成的特征圖片進行對應的標注后存儲于存儲模塊中;
所述特征圖片生成模塊根據用戶選擇對應字體,生成樣本圖片;對樣本圖片中的字符分別向上、下、左、右、左上、左下、右上和右下移動設定距離l,制成對應的特征圖片;并對制成的特征圖片進行對應的標注后存儲于存儲模塊中。
進一步的,n*h<l<N*h。
進一步的,n≤1/4。
進一步的,所述系統的文字字符圖片的切分包含以下實現過程:
使用投影法找出文字字符圖片的初始切分位置,根據初始切分位置將待識別圖像片切分成初始子圖片序列;
所述系統對序列中的初始子圖片使用如下規則進行處理:
A、使用投影法待識別圖像文字進行切分,切分成子圖片序列;將其中的數字、字母和標點符號標記出來;
B、對未標記的子圖片進行判斷:是否滿足L≤M*h,L為子圖片字符投影的寬度,M為系數,h為行高;
對于不滿足條件的子圖片進行切分,切分位置根據以下公式進行確定:
f(x)=g(x)t(x)
重復執行步驟B,直到序列中未標記的子圖片均滿足條件:L≤M*h;
C、對于序列中數字、字母和標點子圖片以外的相鄰兩子圖片的總寬度進行判斷:是否滿足L合≤M*h;
如果滿足,依序對滿足條件的相鄰子圖片進行合并;
重復執行步驟C直到除數字、字母和標點以外的相鄰子圖片總寬度均不滿足L合≤M*h;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都數聯銘品科技有限公司,未經成都數聯銘品科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611250766.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于圖像文字識別的字符切分方法
- 下一篇:一種汽車交易發票的處理方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





