[發明專利]一種基于漢字筆畫特征的中文文本圖像倒置判別方法有效
| 申請號: | 201710695383.2 | 申請日: | 2017-08-15 |
| 公開(公告)號: | CN107609482B | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 王建;龐彥偉 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/40;G06K9/62 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 漢字 筆畫 特征 中文 文本 圖像 倒置 判別 方法 | ||
1.一種基于漢字筆畫特征的中文文本圖像倒置判別方法,包括下列步驟:
(1)判斷輸入掃描文本圖像類型,如果是灰度圖像,則保持不變;如果是彩色圖像,則將將其轉換為灰度圖像,用I表示灰度圖像;
(2)對灰度圖像I進行去噪、對比度增強以及二值化處理,得到的二值化處理結果用B表示;
(3)將B劃分為大小相等的36個子區域,選擇靠近中心位置的16個子區域作為候選文本區域,用Ti,i=1,2,...,16,表示;
(4)對于每個候選文本區域,按照下式計算其相應的中文本點的數目并做歸一化處理,得到表示各候選文本子區域的特征的Ri:
式中,(s,t)∈Ti表示Ri中的各像素點坐標,B(s,t)表示對像素點(s,t)二值化處理的結果,M×N為灰度圖像I的總像素點數;
(5)預設兩個小于1的閾值TH2和TH3,對于某個Ti,如果滿足TH2RiTH3,則將相應的候選文本區域選為特征提取所用的文本區域,用Hk,k=1,2,...,K,表示用于特征提取的文本區域集合,K為文本區域的總數;
(6)選擇兩個模板,模板1為用于描述漢字中左撇和右捺組成結構的“人”形筆畫檢測模板2為用于描述漢字中的橫折筆畫的形的筆畫檢測模板;
(7)使用筆畫特征提取算法,計算文本區域所對應的特征值:N1、N2、M1和M2,筆畫特征提取算法如下:
1)對于某個用于特征提取的文本區域Hk,用形態學細化技術對文本點進行細化處理,最終得到單像素寬的文字骨架結構信息,用S表示細化結果;
2)使用模板1和模板2,分別對S進行模板匹配,對于模板1,過程是:對于Hk中的某一個骨架點,將其與模板1的參考點位置對齊,然后對骨架點鄰域內與模板1對應位置上各點進行“同或”運算;計算Hk內各骨架點“同或”運算結果的累加值,并做歸一化處理,計算結果用Uk(j)表示,其中j表示Hk中的骨架點的序號,對于Hk中第j個骨架點,如果滿足Uk(j)TH3,則將該點標記為第1類特征點;對于模板2,按照類似的過程標記第2類特征點;
3)對于每個Hk中的所有骨架點,使用步驟2)判斷該點是否是兩類特征點,并分別對文本圖像的第1類特征點和第2類特征點數進行累加,將兩類特征點的總數分別作為兩個特征值,用N1和N2表示;
4)將細化結果S旋轉180°,處理結果用S′表示,對S′重復步驟2)和步驟3),用M1和M2表示S′對應的第1類特征點和第2類特征點的總數;
(8)文本圖像倒置檢測:
1)根據特征量N1、N2、M1和M2,計算復合特征值F,即有
2)預設一個大于0.6的閾值TH4,根據F的取值大小,判別文本圖像是否存在倒置,即有
2.根據權利要求1所述的方法,其特征在于,取TH2=0.2,TH3=0.4;閾值TH4在0.6~0.8之間取值。
3.根據權利要求1所述的方法,其特征在于,步驟(2)的步驟如下:
1)采用模板為3×3的中值濾波技術對灰度圖像I進行去噪,處理結果用G表示;
2)采用CLAHE技術,對濾波結果圖像G進行對比度增強處理,處理結果用E表示;
3)使用Otsu法計算E的全局閾值TH1,并使用全局閾值TH1對E進行二值化處理,處理結果用B表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710695383.2/1.html,轉載請聲明來源鉆瓜專利網。





