[發(fā)明專利]一種復(fù)雜背景圖像文字分割方法有效
| 申請(qǐng)?zhí)枺?/td> | 201210560199.4 | 申請(qǐng)日: | 2012-12-20 |
| 公開(公告)號(hào): | CN102968637A | 公開(公告)日: | 2013-03-13 |
| 發(fā)明(設(shè)計(jì))人: | 柏猛;李敏花;呂英俊 | 申請(qǐng)(專利權(quán))人: | 山東科技大學(xué) |
| 主分類號(hào): | G06K9/46 | 分類號(hào): | G06K9/46;G06K9/62 |
| 代理公司: | 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 張勇 |
| 地址: | 266590 山東省青*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 復(fù)雜 背景 圖像 文字 分割 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域中的圖像分割技術(shù),尤其涉及一種復(fù)雜背景圖像文字分割方法。
背景技術(shù)
隨著數(shù)碼相機(jī)、攝像頭、超高速掃描儀等圖像獲取設(shè)備的廣泛應(yīng)用,圖像中信息越來越引起人們的關(guān)注,然而計(jì)算機(jī)理解圖像的內(nèi)容,目前還很困難。嵌入在圖像中的文字,是圖像語義內(nèi)容的一種重要表達(dá)方式。如果能夠自動(dòng)提取和識(shí)別這些文字,就可以讓機(jī)器自動(dòng)理解圖片內(nèi)容并對(duì)圖片進(jìn)行分類,進(jìn)而借助已經(jīng)成熟的文本檢索技術(shù)采用這些文字對(duì)圖片進(jìn)行標(biāo)注和檢索,從而為基于內(nèi)容的圖像和視頻檢索提供一種途徑。然而,嵌入在圖像中的文字通常都帶有復(fù)雜背景,即使文本內(nèi)容在圖像中能被準(zhǔn)確檢測(cè)到,在沒有去除背景之前,現(xiàn)有的OCR系統(tǒng)難以識(shí)別出字符,因而在提交給OCR系統(tǒng)之前還需要一個(gè)文字分割過程。因此,如何從復(fù)雜背景圖像中分割文本信息,成為以文字為線索來理解和檢索圖像內(nèi)容的一個(gè)關(guān)鍵任務(wù)。
現(xiàn)有的圖像文字分割技術(shù)主要分為以下三類:基于閾值的方法、基于聚類的方法和基于統(tǒng)計(jì)模型的方法。
基于閾值的方法一般根據(jù)文字塊中前景和背景的亮度分布自適應(yīng)地選取一個(gè)全局閾值或自適應(yīng)局部閾值。在圖像背景比較單一時(shí)該類方法能取得較好的效果;當(dāng)文字具有較復(fù)雜的背景,例如文字的灰度可能介于背景的多個(gè)灰度之間時(shí),閾值法不再適用。
基于聚類的方法一般首先假定文字塊中所有像素根據(jù)顏色可以分為K類,文字像素對(duì)應(yīng)于其中一類,其余各類均為背景;然后采用經(jīng)典的無監(jiān)督聚類算法對(duì)所有像素進(jìn)行聚類。這類方法可用于復(fù)雜背景的情況。但當(dāng)背景中含有與文字顏色相同或相近的成分時(shí),這些成分會(huì)被誤分入文字類,從而產(chǎn)生大量的殘余背景,影響OCR識(shí)別。
基于統(tǒng)計(jì)模型的方法首先為文字塊內(nèi)所有像素或者文字像素建立概率模型,一般根據(jù)顏色建立高斯混合模型(Gaussian?Mixture?Model,GMM),所有同色區(qū)域用一個(gè)Gaussian核函數(shù)表示。然后使用EM算法估計(jì)模型參數(shù),最后根據(jù)最大似然準(zhǔn)則確定每個(gè)區(qū)域的類別。由于單純地利用了顏色信息,GMM模型存在著與聚類方法同樣的問題,而且GMM核函數(shù)的個(gè)數(shù)難以確定。
上述各種文字分割方法,只利用了圖像底層局部的灰度或彩色信息,沒有考慮到文字的空間或全局上下文信息。因而,對(duì)復(fù)雜背景中的文字分割效果不好。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了解決上述問題,提供一種復(fù)雜背景圖像文字分割方法,根據(jù)復(fù)雜背景圖像中文字信息的特點(diǎn),融合圖像底層的局部顏色、紋理特征和標(biāo)簽層全局特征,并采用由粗到精兩級(jí)分割的方法,從而提高復(fù)雜背景圖像文字分割的準(zhǔn)確率。該方法對(duì)背景簡(jiǎn)單圖像和背景復(fù)雜圖像均具有較好的分割效果,具有一定的通用性和實(shí)用性。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
一種復(fù)雜背景圖像文字分割方法,主要包括以下步驟:進(jìn)行圖像讀?。粚?duì)讀取的圖像進(jìn)行文字區(qū)域讀取;對(duì)讀取的文字區(qū)域進(jìn)行底層顏色特征抽??;對(duì)抽取過底層顏色特征的文字區(qū)域進(jìn)行底層紋理特征抽取;對(duì)抽取出來的文字區(qū)域的底層顏色特征和底層紋理特征進(jìn)行融合得到文字區(qū)域的底層局部特征;對(duì)文字區(qū)域的底層局部特征進(jìn)行粗分類,然后在粗分類的結(jié)果上抽取文字區(qū)域的標(biāo)簽層全局特征;將文字區(qū)域的底層局部特征與文字區(qū)域的標(biāo)簽層全局特征進(jìn)行融合得到文字區(qū)域所有像素的特征向量;對(duì)文字區(qū)域中所有像素特征向量進(jìn)行訓(xùn)練得到第一級(jí)文字分割的分類器;用訓(xùn)練好的分類器對(duì)圖像的特征分類,實(shí)現(xiàn)第一級(jí)文字分割;對(duì)第一級(jí)分割的結(jié)果進(jìn)行連通元標(biāo)定;抽取連通元特征,利用文字連通元與背景連通元的特征差異,進(jìn)行連通元篩選,去除背景連通元,實(shí)現(xiàn)第二級(jí)文字分割;輸出文字分割結(jié)果。
一種復(fù)雜背景圖像文字分割方法,具體步驟如下:
步驟(1):開始,讀取圖像;
步驟(2):將圖像中的文字區(qū)域塊提取出來,并將文字區(qū)域塊保存到相應(yīng)位置;
步驟(3):判斷是否所有的文字區(qū)域塊提取完成,如果提取完成則進(jìn)入步驟(4);如果未提取完成返回步驟(2);
步驟(4):在RGB顏色空間抽取文字區(qū)域塊中每個(gè)像素點(diǎn)的顏色特征,得到6維底層局部顏色特征;如果所有像素點(diǎn)的顏色特征抽取完畢就進(jìn)入步驟(5);
步驟(5):抽取文字區(qū)域塊中每個(gè)像素點(diǎn)的紋理特征:首先將文字區(qū)域塊轉(zhuǎn)換為灰度圖像,然后在灰度圖像上抽取Gabor紋理特征,每個(gè)像素點(diǎn)得到6維底層局部紋理特征;
步驟(6):將6維顏色特征和6維紋理特征進(jìn)行特征融合,得到12維圖像底層局部特征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東科技大學(xué),未經(jīng)山東科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210560199.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種超低溫鍍鋁紙的制作方法
- 下一篇:建筑物太陽能利用系統(tǒng)
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





