[發(fā)明專利]基于字符切分和顏色聚類的數(shù)字視頻中的字符提取方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200910081927.1 | 申請(qǐng)日: | 2009-04-08 |
| 公開(公告)號(hào): | CN101515325A | 公開(公告)日: | 2009-08-26 |
| 發(fā)明(設(shè)計(jì))人: | 黃曉冬;馬華東;張赫 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/34 |
| 代理公司: | 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人: | 夏憲富 |
| 地址: | 100876*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 字符 切分 顏色 數(shù)字視頻 中的 提取 方法 | ||
1.一種基于字符切分和顏色聚類的數(shù)字視頻中的字符提取方法,其特征在 于,包括下列操作步驟:
(1)字符切分:先將字符區(qū)域的三通道彩色圖像轉(zhuǎn)換為單通道灰度圖像, 再采用基于垂直投影特征的分析切分方法,即利用字符區(qū)域與字符間隔區(qū)域的 特征差異,按照Sobel算子中計(jì)算垂直方向的微分的計(jì)算模板,分別計(jì)算所述 單通道灰度圖像中的每個(gè)像素的縱向梯度值,對(duì)該梯度值取絕對(duì)值并進(jìn)行縱向 相加后,得到其縱向梯度值之和的梯度值數(shù)組,用于反映圖像垂直方向的梯度 特性,并用作字符切分的依據(jù);然后用近鄰平均方法平滑該梯度值數(shù)組:選取 某個(gè)位置左右兩邊的梯度值與該位置的梯度值的平均值,用作該位置的新的梯 度值和計(jì)算用于全面表征垂直投影特征的峰谷差比;最后根據(jù)峰谷差比進(jìn)行垂 直投影來(lái)切分字符區(qū)域圖像,將每一行包含多個(gè)字符的區(qū)域圖像,切分成只包 含單個(gè)字符的若干個(gè)子區(qū)域圖像;
(2)字符提?。合韧ㄟ^(guò)擴(kuò)展圖像、對(duì)圖像插值放大和圖像增強(qiáng)的預(yù)處理, 再用設(shè)置聚類個(gè)數(shù)為4的K-Means算法對(duì)圖像中的顏色特征進(jìn)行顏色聚類,然 后判別聚類結(jié)果和分析連通區(qū)域,從4個(gè)備選圖像找到包含最多字符信息的圖 像作為目標(biāo)圖像,從而快速刪除大部分背景區(qū)域信息;再對(duì)目標(biāo)圖像進(jìn)行連通 特征分析,采用由外向內(nèi)填充和對(duì)字符圖像進(jìn)行去噪處理,繼續(xù)去除剩余的非 字符區(qū)域后,分別得到三種類型的字符圖像:?jiǎn)蝹€(gè)字符提取圖像、字符區(qū)域的 整體提取圖像和由單個(gè)字符提取圖像拼接成的整體拼接圖像,一起輸入給光學(xué) 字符識(shí)別OCR系統(tǒng)進(jìn)行識(shí)別;其中后兩種圖像是用OCR的語(yǔ)義處理功能,根 據(jù)上下文更準(zhǔn)確地確定形近字而提高識(shí)別效果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述特征差異是指:字符區(qū) 域的特點(diǎn)是它的空間頻率變化強(qiáng)烈,而字符間隔區(qū)域的空間頻率變化相對(duì)較?。? 對(duì)應(yīng)到梯度上,則是字符區(qū)域的梯度較大,而字符間隔的梯度較小。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述字符切分是依據(jù)最有用 的縱向梯度信息進(jìn)行切分,且對(duì)字符區(qū)域圖像采用的梯度計(jì)算模板是Sobel算 子中計(jì)算垂直方向的微分的計(jì)算模板:
所述基于垂直投影特征的分析切分方法的依據(jù)是視頻中字符通常呈水平排 列,故對(duì)于根據(jù)上述計(jì)算模板對(duì)字符區(qū)域圖像中的像素進(jìn)行計(jì)算得到的梯度值 的絕對(duì)值,進(jìn)行垂直方向上的投影,以便考察感興趣的區(qū)域并進(jìn)行字符切分; 因字符區(qū)域?qū)?yīng)的梯度值大于字符間隔區(qū)域的梯度值,故在字符切分中,用縱 向梯度投影作為切分的依據(jù),再通過(guò)各種啟發(fā)式規(guī)則來(lái)最終確定切分線。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910081927.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





