[發明專利]基于連接體和模板的字符識別方法在審
| 申請號: | 201810093945.0 | 申請日: | 2018-01-31 |
| 公開(公告)號: | CN108388898A | 公開(公告)日: | 2018-08-10 |
| 發明(設計)人: | 向保松;王井俊;唐武斌;簡剛 | 申請(專利權)人: | 寧波市科技園區明天醫網科技有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/38;G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 毛翔威 |
| 地址: | 315040 浙江省寧波市高新區創苑路80*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 連接體 字符識別 字符模板 圖像二值化 自定義模板 常規字符 多個模板 灰度圖像 模板匹配 輸出識別 算法實現 圖像識別 字符分割 字符圖像 不規則 加載 字體 合并 轉化 | ||
本發明公開了一種基于連接體和模板的字符識別方法,通過獲取字符圖像→轉化灰度圖像→圖像二值化→連接體算法實現字符分割→字符模板加載→模板匹配→輸出識別結果,從而實現了數字和圖像識別。本發明所得到的基于連接體和模板的字符識別方法,能夠支持常規字符識別的同時,解決非常規,即超大的或者超小,或字體不規則的字符無法識別問題。并讓自定義模板變得簡單易操作,字符模板直接在原有模板上增加,也可以方便實現多個模板合并。
技術領域
本發明涉及光學識別以及醫學影像處理領域,特別是基于連接體和模板的字符識別方法。
背景技術
在醫院的電子膠片打印系統中,需用到字符識別技術,識別出電子膠片上的患者編號和檢查編號,根據識別出來的信息匹配患者信息,進行后續的患者自助膠片打印服務。
目前,識別引擎有tesseract、office document image、ABBYY,它們的識別字符的特征是常規的字體風格、常規字體大小方面,能夠滿足90%的識別場景需要;但是在醫學影像設備中,有一些影像設備在影像上產生的很多字符形狀不規則,字符特別小,在放大很多倍情況下肉眼才勉強看得清楚,并且放大之后字符有明顯的鋸齒狀。這種情況下,普通識別引擎無法精準識別,準確率較低,無法滿足程序識別要求。另外,很多醫療設備是從國外進口,價格十分昂貴,技術支持難以聯系和溝通,很難從調整或更換設備的方式來解決問題。在電子膠片識別中,任何一個字符無法識別都意味著巨大的人工成本,甚至引起醫患糾紛,因此保證所有字符的準確識別就顯的尤為重要。因此,在這種背景下,提高軟件對影像的字符識別率,尤其是對非常規字符的識別準確率,是解決該問題的一種廉價可行的方法。
目前,解決此場景方案有a、字符分割:基于投影直方圖極值點作為候選分割點并使用分類器+Beam Search (束搜索)搜索最佳分割點 ,對單個文字進行分割;b、特征提取:LBP(局部二值模式)提取文字特征;c、模板匹配。
但是上述解決方案的缺點是對于超大的或者超小的字符無法識別,模板的自定義和模板疊加特別麻煩,且效果不好。程序包龐大臃腫,維護和使用繁瑣。
發明內容
本發明的目的是為了解決上述現有技術的不足而提供一種基于連接體和模板的字符識別方法,提高字符識別準確率。
為了實現上述目的,本發明所設計的基于連接體和模板的字符識別方法,包括以下步驟:
a、獲取字符圖像:在指定區域內獲取需要識別的字符圖像;
b、轉化灰度圖像:將彩色圖像轉換為灰度圖像,即將彩色圖像的數據結構轉換換成YUV數據結構,同時去除YUV數據結構中的UV色度塊,保留Y數據塊,即亮度塊;
c、圖像二值化:設定閾值,將計算機內存中大于設定閾值的亮度值設置成255,小于這個值的就設置成0,通常,亮度值為0的代表黑色,亮度值為255代表白色,從而得到只保留純白的字符和純黑背景的圖像;
d、連接體算法實現字符分割:首先在掃描之前需準備好兩個隊列,一個當做暫存隊列,一個當做字符隊列;然后開始掃描,掃描從左上角開始,記錄坐標為iCol=0,iRow=0,逐行掃描,通過for循環判斷圖像矩陣坐標位置byPicture[iCol][ iRow]處的字符亮度值是否等于255;
當掃描到字符存在的時候,首先將這個坐標放入暫存隊列,然后通過while循環獲取暫存隊列的第一個坐標,存放到字符隊列,同時執行上中下三行,而對于每行又執行左中右三列掃描,判斷是否存在字符亮度值為255的點,如果存在則將當前坐標放入暫存隊列;
如此循環就會將連著的所有位置找出來,然后把這些連接成字符的字符矩陣緩存在一個字符矩陣隊列中,要求在每次掃描完都記錄當前字符的右上角位置,作為下一個字符左上角開始掃描的位置,如此循環切割出所有字符矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波市科技園區明天醫網科技有限公司,未經寧波市科技園區明天醫網科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810093945.0/2.html,轉載請聲明來源鉆瓜專利網。





