[發(fā)明專利]一種復(fù)雜背景圖像中的文本提取方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310210040.4 | 申請(qǐng)日: | 2013-05-29 |
| 公開(公告)號(hào): | CN103268481A | 公開(公告)日: | 2013-08-28 |
| 發(fā)明(設(shè)計(jì))人: | 達(dá)飛鵬;劉超;饒立;李燕春;呂江昭;王辰星;何學(xué)勇 | 申請(qǐng)(專利權(quán))人: | 焦點(diǎn)科技股份有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/46 |
| 代理公司: | 江蘇永衡昭輝律師事務(wù)所 32250 | 代理人: | 齊旺 |
| 地址: | 210003 江蘇省南京*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 復(fù)雜 背景 圖像 中的 文本 提取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,尤其是涉及一種復(fù)雜背景圖像中的文本提取方法。
背景技術(shù)
近年來(lái),隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的飛速發(fā)展,以網(wǎng)絡(luò)為載體的網(wǎng)絡(luò)文化正成為當(dāng)前文化發(fā)展的一個(gè)新趨勢(shì),隨之而來(lái)的是諸如純文本、數(shù)字圖像、視頻等數(shù)字信息以幾何級(jí)速度增長(zhǎng),給人們的生活帶來(lái)重大影響。這些信息中存在大量數(shù)據(jù),不但包括對(duì)人們有益的信息,還有越來(lái)越多的淫穢、暴力、反動(dòng)信息。這些信息檢測(cè)工作靠人工檢測(cè)顯然是不現(xiàn)實(shí)的,需要計(jì)算機(jī)能夠自動(dòng)識(shí)別檢測(cè)。目前文字識(shí)別技術(shù)已經(jīng)相對(duì)成熟,因此,定位并提取出復(fù)雜圖像及視頻中的文本信息就有了重大意義。
目前文本定位方法主要有基于連通域的方法、基于紋理特征的方法、基于邊緣檢測(cè)的方法、基于角點(diǎn)檢測(cè)的方法、基于機(jī)器學(xué)習(xí)的方法以及以上幾個(gè)方法的組合。這些方法在復(fù)雜背景圖像的應(yīng)用上各有優(yōu)缺點(diǎn),很難找到一種算法對(duì)各種圖像中文本進(jìn)行魯棒的定位。
復(fù)雜背景圖像中的文本提取具有廣泛的應(yīng)用前景,同時(shí)也是一個(gè)具有挑戰(zhàn)性工作,需要進(jìn)一步的深入研究。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題在于克服現(xiàn)有技術(shù)的不足,本發(fā)明提出了一種復(fù)雜背景圖像中的文本提取方法。
為解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案如下:一種復(fù)雜背景圖像中的文本提取方法,其步驟如下:
步驟1:利用加權(quán)平均值法將源圖像src灰度化,得到灰度圖像Img;
步驟2:檢測(cè)灰度圖像Img中的角點(diǎn),將角點(diǎn)坐標(biāo)存入角點(diǎn)容器中,構(gòu)造角點(diǎn)矩陣;
步驟3:去除角點(diǎn)矩陣中的孤立角點(diǎn);
步驟4:利用積分投影變換實(shí)現(xiàn)文本定位;
步驟5:篩選并去除非文本區(qū)域;
步驟6:從源圖像src中截取出文本子圖,判斷文本子圖的背景是否復(fù)雜;如果文本子圖的背景判斷為復(fù)雜,則執(zhí)行步驟7;如果文本子圖的背景判斷為不復(fù)雜,則執(zhí)行步驟8;
步驟7:對(duì)背景復(fù)雜的文本子圖進(jìn)行顏色聚類,進(jìn)而去除文本子圖的背景后提取出文本信息;執(zhí)行步驟9;
步驟8:對(duì)背景不復(fù)雜的文本子圖灰度化,再利用自適應(yīng)閾值選取算法進(jìn)行二值化,選取前景與背景區(qū)分閾值,提取圖像文本子圖的文本信息;
步驟9:循環(huán)執(zhí)行步驟6到步驟9,直到源圖像src中所有文本子圖的文本信息精確提取完成。
步驟1中,所述利用加權(quán)平均值法將源圖像src灰度化,得到灰度圖像Img,源圖像src中每點(diǎn)的灰度值計(jì)算公式為:
Gray=0.30R+0.59G+0.11B
其中,R、G、B分別為該點(diǎn)在源圖像src中的三通道像素值,Gray為該點(diǎn)灰度化后的灰度值。
步驟2中,所述檢測(cè)灰度圖像Img中的角點(diǎn),將角點(diǎn)坐標(biāo)存入角點(diǎn)容器中,構(gòu)造角點(diǎn)矩陣;該步驟利用susan算子檢測(cè)灰度圖像Img中的角點(diǎn),具體步驟如下:
步驟2.1:構(gòu)造一個(gè)與灰度圖像Img矩陣同等大小的二維矩陣,記為角點(diǎn)矩陣C,將C中每個(gè)值設(shè)置為0,并構(gòu)造角點(diǎn)容器V存儲(chǔ)角點(diǎn)坐標(biāo);
步驟2.2:構(gòu)造一個(gè)近似圓N(x,y)作為susan檢測(cè)模板,N(x,y)包含37個(gè)像素,檢測(cè)模板N(x,y)的中心為模板的核;
步驟2.3:選取灰度圖像Img中任意一個(gè)像素點(diǎn)r0作為待檢測(cè)點(diǎn),將檢測(cè)模板N(x,y)的核放在r0處,比較模板N(x,y)內(nèi)每個(gè)非核點(diǎn)的灰度值與核位置的灰度值,比較函數(shù)如下:
式中(x0,y0)為核在灰度圖像Img中坐標(biāo),(x,y)為模板N(x,y)中一個(gè)非核點(diǎn)坐標(biāo),f(x0,y0)和f(x,y)分別為核坐標(biāo)(x0,y0)和非核點(diǎn)(x,y)處灰度值,C(x,y)為(x,y)處灰度比較結(jié)果;若非核點(diǎn)在圖像外,則將C(x,y)直接置為0;
步驟2.4:計(jì)算像素點(diǎn)r0總的灰度差異函數(shù)值,即對(duì)步驟2.3中的比較結(jié)果求和:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于焦點(diǎn)科技股份有限公司,未經(jīng)焦點(diǎn)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310210040.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





