[發明專利]一種復雜背景圖像文字分割方法有效
| 申請號: | 201210560199.4 | 申請日: | 2012-12-20 |
| 公開(公告)號: | CN102968637A | 公開(公告)日: | 2013-03-13 |
| 發明(設計)人: | 柏猛;李敏花;呂英俊 | 申請(專利權)人: | 山東科技大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張勇 |
| 地址: | 266590 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 復雜 背景 圖像 文字 分割 方法 | ||
1.一種復雜背景圖像文字分割方法,其特征是,主要包括以下步驟:進行圖像讀取;對讀取的圖像進行文字區域讀取;對讀取的文字區域進行底層顏色特征抽取;對抽取過底層顏色特征的文字區域進行底層紋理特征抽取;對抽取出來的文字區域的底層顏色特征和底層紋理特征進行融合得到文字區域的底層局部特征;對文字區域的底層局部特征進行粗分類,然后在粗分類的結果上抽取文字區域的標簽層全局特征;將文字區域的底層局部特征與文字區域的標簽層全局特征進行融合得到文字區域所有像素的特征向量;對文字區域中所有像素特征向量進行訓練得到用于第一級文字分割的分類器;用訓練好的分類器對圖像的特征分類,實現第一級文字分割;對第一級分割的結果進行連通元標定;抽取連通元特征,利用文字連通元與背景連通元的特征差異,進行連通元篩選,去除背景連通元,實現第二級文字分割;輸出文字分割結果。
2.如權利要求1所述的一種復雜背景圖像文字分割方法,其特征是,具體步驟如下:
步驟(1):開始,讀取圖像;
步驟(2):將圖像中的文字區域塊提取出來,并將文字塊保存到相應位置;
步驟(3):判斷是否所有的文字區域塊提取完成,如果提取完成則進入步驟(4);如果未提取完成返回步驟(2);
步驟(4):在RGB顏色空間抽取文字區域塊中每個像素點的顏色特征,得到6維局部顏色特征;如果所有像素點的顏色特征抽取完畢就進入步驟(5);
步驟(5):抽取文字區域塊中每個像素點的紋理特征:首先將文字塊轉換為灰度圖像,然后在灰度圖像上抽取Gabor紋理特征,每個像素點得到6維紋理特征;
步驟(6):將6維顏色特征和6維紋理特征進行特征融合,得到12維圖像底層局部特征;
步驟(7):提取文字區域塊的標簽層全局特征:將步驟(6)得到的12維圖像底層局部特征送入分類器訓練,用訓練好的分類器分別對文字區域塊中的每個像素點進行分類,得到文字區域整體的粗略類別標簽分布,計算每個像素點屬于文字類和背景類的概率密度,然后抽取每個像素點3×3鄰域屬于文字類和背景類的概率密度作為標簽層全局特征,每個像素點共得到18維標簽層全局特征,如果所有的像素點標簽層全局特征抽取完畢就進入步驟(8);
步驟(8):判斷是否所有像素點特征計算是否完成,如果完成則進入步驟(9);如果未完成則返回步驟(4);
步驟(9):將12維圖像底層局部特征和18維標簽層全局特征進行融合,每個像素點得到一個30維的特征向量;
步驟(10):利用條件隨機場模型對文字塊中每個像素點30維特征進行訓練,得到用于第一級分割的分類器;
步驟(11):采用步驟(10)得到的分類器對文字區域中的像素進行分類,將文字區域塊中的像素分為文字類和背景類,得到二值化的分割圖像,實現文字區域的第一級粗分割;
步驟(12):對二值化的粗分割圖像進行連通元標定,采用4連通標定法;
步驟(13):對步驟(12)標定好的每個連通元,抽取連通元特征,然后采用閾值分類器刪除背景連通元,實現文字區域的第二級分割;
步驟(14):輸出文字分割結果。
3.如權利要求2所述的一種復雜背景圖像文字分割方法,其特征是,所述步驟(4)的顏色特征抽取方法為:
首先將圖像分解為R、G、B三個顏色通道,對每個像素點抽取相應的R、G、B顏色分量和8鄰域像素R、G、B三個分量的均值。
4.如權利要求2所述的一種復雜背景圖像文字分割方法,其特征是,所述步驟(5)的Gabor紋理特征的抽取方法是:
在文字區域塊的灰度圖像上用一組同一頻率不同方向不同尺度的Gabor濾波器進行濾波,然后將濾波后的圖像按照公式進行合并,其中,i表示尺度,j表示方向,gabori表示尺度i的合并Gabor濾波圖像,表示尺度i方向j上的Gabor濾波圖像,然后在濾波后的合并圖像上抽取相應的紋理特征,抽取每個像素點3×3鄰域Gabor系數的均值和方差作為每個像素點的紋理特征。
5.如權利要求2所述的一種復雜背景圖像文字分割方法,其特征是,所述步驟(7)中,標簽層全局特征的抽取方法為:采用神經網絡對訓練文字區域塊中的每個像素點進行分類,得到文字區域整體的粗略類別標簽分布,計算每個像素點屬于文字類和背景類的概率密度,然后抽取該像素點3×3鄰域屬于文字類和背景類的概率密度作為標簽層全局特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東科技大學,未經山東科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210560199.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種超低溫鍍鋁紙的制作方法
- 下一篇:建筑物太陽能利用系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





