[發(fā)明專利]智能移動終端場景文字處理方法有效
| 申請?zhí)枺?/td> | 201410581464.6 | 申請日: | 2014-10-27 |
| 公開(公告)號: | CN104408449B | 公開(公告)日: | 2018-01-30 |
| 發(fā)明(設(shè)計(jì))人: | 盧朝陽;李靜;劉曉佩;姜維;通天意;汪文芳 | 申請(專利權(quán))人: | 西安電子科技大學(xué)寧波信息技術(shù)研究院 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 寧波誠源專利事務(wù)所有限公司33102 | 代理人: | 鄧青玲 |
| 地址: | 315200 浙江省寧波市鎮(zhèn)*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 智能 移動 終端 場景 文字處理 方法 | ||
1.一種智能移動終端場景文字處理方法,其特征在于:包括如下步驟:
步驟1:基于邊緣的文本粗檢測,具體包括:
(1-1)、采用彩色圖像邊緣檢測方法對智能移動終端內(nèi)的輸入場景圖像I進(jìn)行邊緣檢測,得到第一中間處理圖像;
(1-2)、對第一中間處理圖像進(jìn)行形態(tài)學(xué)運(yùn)算,連接第一中間處理圖像中的斷裂文字以及相鄰的文字,得到第二中間處理圖像;
(1-3)、通過尋找連通域的方法對第二中間處理圖像進(jìn)行處理,從而獲得輸入場景圖像I的候選文本區(qū)域集合S;
步驟2、獲取輸入場景圖像I的筆畫寬度圖T,對候選文本區(qū)域集合S中的每個候選文本區(qū)域進(jìn)行筆畫寬度和幾何特征分析,剔除不符合要求的非文本區(qū)域,最后輸出定位結(jié)果圖L1;
步驟3、識別預(yù)處理,具體包括:
(3-1)、對定位結(jié)果圖L1的文本區(qū)域進(jìn)行對比度增強(qiáng);
(3-2)、對增強(qiáng)后的文本區(qū)域進(jìn)行中值濾波;
(3-3)、對中值濾波后的文本區(qū)域進(jìn)行二值化;
(3-4)、對二值化后的文本區(qū)域進(jìn)行字符切分;
步驟4、對切分后的單字符進(jìn)行規(guī)范化和方向線素特征的提取操作,具體包括:
(4-1)、對切分后的每個字符進(jìn)行裁剪,去掉字符周圍的白色背景,對剪裁后的每幅字符圖像采用雙線性插值法將其尺寸統(tǒng)一變換為N×N;
(4-2)、提取統(tǒng)一尺寸后單個字符的輪廓,并計(jì)算其方向線素特征;
(4-3)、采用距離分類器對每個字符進(jìn)行識別,得到每個字符最接近的X個字符;
步驟5、基于Gabor特征的細(xì)分類,具體包括:
(5-1)、將每個字符采用雙線性插值法將其尺寸統(tǒng)一變換為M×M;
(5-2)、對統(tǒng)一尺寸后的字符進(jìn)行Gabor變換,提取Gabor特征;
(5-3)、在(4-3)識別后得到每個字符最接近的X個字符的基礎(chǔ)上,利用距離分類器再次進(jìn)行識別,得出每個字符的識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的智能移動終端場景文字處理方法,其特征在于:所述步驟2具體包括:
(2-1)、利用Canny邊緣檢測方法對輸入場景圖像I進(jìn)行邊緣檢測,得到輸入場景圖像I的邊緣圖,同時記錄下每個邊緣像素點(diǎn)的梯度方向;
(2-2)、對邊緣像素點(diǎn)進(jìn)行筆畫寬度變換:
(2-2-1)、假設(shè)p是一個邊緣像素點(diǎn),設(shè)dp為邊緣像素點(diǎn)p的梯度方向,按照dp方 向沿著路線r=p+n·dp(n≧0)在邊緣圖的邊緣像素點(diǎn)中尋找與其匹配的另一個邊緣像素點(diǎn)q,設(shè)dq為邊緣像素點(diǎn)q的梯度方向,dq與dp方向相反或dq=–dp±π/2;
如果p沒有找到與其匹配的像素點(diǎn)q或者dq與dp的方向不是相反的,則該路線r=p+n·dp(n≧0)被廢棄,需要重新選擇新的邊緣像素點(diǎn)p并且找到與之相對的邊緣像素點(diǎn)q;
如果找到相匹配的像素點(diǎn)q,則對應(yīng)于[p,q]這條路線上的每個像素點(diǎn)的筆畫寬度值均被指定為||p–q||,||p–q||為像素點(diǎn)p與像素點(diǎn)q之間的歐氏距離,如果[p,q]這條路線上的像素點(diǎn)已經(jīng)有了一個筆畫寬度值S,則取S與||p–q||中較小的一個值作為該像素點(diǎn)的實(shí)際筆畫寬度值;
(2-2-2)、重復(fù)(2-2-1),直到計(jì)算出所有未被廢棄的路線上像素的筆畫寬度值;
(2-2-3)、再次遍歷所有沒有被丟棄的路線,計(jì)算出每個路線上全部像素的筆畫寬度均值M,然后找出這條路線上所有筆畫寬度值大于M的像素,再把這些像素的筆畫寬度值置為M,直到所有路線遍歷完畢后,最終得到輸入場景圖像I的筆畫寬度圖T;
(2-3)、在步驟(2-2)得到的輸入場景圖像I的筆畫寬度圖T基礎(chǔ)上,對應(yīng)找到步驟1得到的候選文本區(qū)域集合S,然后對候選文本區(qū)域集合S進(jìn)行篩選,篩選規(guī)則如下:
(2-3-a)、將長寬比例不在0.1到10之間的候選文本區(qū)域剔除;
(2-3-b)、將字符寬度不在W/20和W個像素之間,高度不在H/20和H之間的候選文本區(qū)域剔除,其中W和H分別表示圖像的寬度和高度;
(2-3-c)、將面積小于20個像素的候選文本區(qū)域刪除;
(2-3-d)、對候選文本區(qū)域集合S進(jìn)行二值化,計(jì)算黑色像素點(diǎn)所占的比例Rb,將黑色像素點(diǎn)所占的比例Rb不在0.2和0.8之間的候選文本區(qū)域剔除,Rb的定義為
其中,f(i,j)表示的是候選文本區(qū)域圖像中(i,j)位置的像素值,w,h分別表示的是候選文本區(qū)域的寬度和高度,⊕表示的是異或運(yùn)算;
(2-3-e)、對候選文本區(qū)域集合S進(jìn)行二值化,計(jì)算該區(qū)域的交叉性Rcc,將交叉性Rcc不在0.05和0.6之間的候選文本區(qū)域剔除,交叉性Rcc的定義為:
其中,f(i,j)表示的是候選文本區(qū)域圖像中(i,j)位置的像素值,f(i,j+1)表示的是候選文本區(qū)域圖像中(i,j+1)位置的像素值,w,h分別表示的是候選文本區(qū)域的寬度和高度,⊕表示的是異或運(yùn)算;
(2-3-f)、對候選文本區(qū)域集合S進(jìn)行筆畫寬度變換,得到將所有候選文本區(qū)域的第一筆畫寬度圖,將候選文本區(qū)域集合S反色后再進(jìn)行筆畫寬度變換,得到將所有候選文本區(qū)域的第二筆畫寬度圖,如果某一候選文本區(qū)域的第一筆畫寬度圖和第二筆畫寬度圖中,筆畫寬度方差均超過筆畫寬度的平均值的一半,并且相鄰像素的筆畫寬度比均超過3.0,則將該候選文本區(qū)域剔除;
(2-4)、文本檢測輸出:經(jīng)過(2-3)的篩選后,得到最終的文本區(qū)域,然后根據(jù)各個文本區(qū)域的位置關(guān)系,按照從上到下、從左至右的規(guī)則進(jìn)行排序和編號,排序完成之后,將文本區(qū)輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué)寧波信息技術(shù)研究院,未經(jīng)西安電子科技大學(xué)寧波信息技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410581464.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





