[發(fā)明專利]文字行提取方法和裝置有效
| 申請?zhí)枺?/td> | 201010568411.2 | 申請日: | 2010-11-30 |
| 公開(公告)號: | CN102063619A | 公開(公告)日: | 2011-05-18 |
| 發(fā)明(設計)人: | 李永彬 | 申請(專利權)人: | 漢王科技股份有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 提取 方法 裝置 | ||
?
技術領域
本發(fā)明屬于光學字符識別領域,特別涉及一種文字行提取方法和裝置。
背景技術
電子掃描筆(簡稱掃描筆)是OCR的重要應用之一。掃描筆的技術原理為:首先,光學攝像頭按照一定頻率對被掃描資料進行連續(xù)拍照,獲取被掃資料的圖像序列,然后將圖像序列拼接成一幅全景二值圖像,最后在得到的全景圖像中提取待識別文字行并進行OCR識別。
文字行提取有多種方法,大體分為自頂向下、自底向上以及自頂向下自底向上兩者相結合三種,但這些方法多是針對印刷體文檔或者手寫文本的,對于掃描筆獲取的全景二值圖像處理效果不好。這是因為掃描筆獲取的全景二值圖像具有其自身的不同于印刷體文檔及手寫文本的特點:(1)圖像內(nèi)的文字行很少,圖像內(nèi)的字符存在不完整的情況,故得到的圖像不利于信息統(tǒng)計,使部分自底向上的方法失效;(2)圖像的文字行形狀多變,有可能是傾斜的,甚至是彎曲的,使部分自頂向下的方法失效。為此,需要一種專門針對掃描筆獲取的全景二值圖像的文字行提取方法。
?
發(fā)明內(nèi)容
本發(fā)明所要解決的問題為提供一種文字行提取方法和裝置,利用全景二值圖像的特點去除圖像中的不完整字符,有效減小了不完整字符對合并的干擾,然后采用一種自底向上和自頂向下相結合的方法實現(xiàn)文字行提取。
本方法公開了一種文字行提取方法,包括如下步驟:
步驟一:對全景二值圖像中的各連通域進行統(tǒng)計,得到字符寬度和字符高度,根據(jù)字符寬度和字符高度對各連通域進行合并,得到第一尺度塊;
步驟二:將得到的第一尺度塊進行排序,得到各第一尺度塊間的參考水平間距,根據(jù)參考水平間距將各第一尺度塊進行合并得到第二尺度塊;
步驟三:將得到的第二尺度塊進行排序,得到各第二尺度塊間的第二參考水平間距,根據(jù)第二參考水平間距將各第二尺度塊進行合并得到第三尺度塊;
步驟四:將得到的第三尺度塊進行排序,排序后將第三尺度塊左右兩端既定數(shù)目的第一尺度塊作延長線,根據(jù)延長線將各第三尺度塊合并為文字行。
所述步驟一之前還包括:
步驟a:標記全景二值圖像中的連通域,統(tǒng)計各連通域的高度得到全景二值圖像中的平均字符高;
步驟b:去除全景二值圖像邊緣處高度小于平均字符高既定比例的連通域。
所述步驟一中對全景二值圖像中的各連通域進行統(tǒng)計時,按各連通域的寬度值統(tǒng)計對應的連通域個數(shù),按寬度值從大到小的順序將其對應的連通域個數(shù)加和,取加和大于等于連通域總數(shù)的五分之一時對應的寬度值作為字符寬度。
所述步驟一中對全景二值圖像中的各連通域進行統(tǒng)計時,按各連通域的高度值統(tǒng)計對應的連通域個數(shù),按高度值從大到小的順序將其對應的連通域個數(shù)加和,取加和值大于等于連通域總數(shù)的五分之一時對應的高度值作為字符高度。
所述步驟一之后還包括:去除小于字符高度二分之一的第一尺度塊。
所述步驟二的參考水平間距為兩相鄰的第一尺度塊間的水平間距的中值。
所述步驟二中將各第一尺度塊進行合并得到第二尺度塊時,依次遍歷各第一尺度塊,將未經(jīng)合并的當前第一尺度塊作為第二尺度塊,并將滿足既定條件的未經(jīng)合并的第一尺度塊合并到所述第二尺度塊。
所述既定條件為第二尺度塊與相鄰的第一尺度塊在豎直方向有交疊,且交疊高度大于等于兩者中高度較小者的三分之一,且第二尺度塊與相鄰的第一尺度塊的水平間距小于等于2倍參考水平間距且大于等于負的字符寬度的三分之一。
所述步驟三的第二參考水平間距為兩相鄰的第二尺度塊間的小于2倍字符寬度的水平間距的中值。
所述步驟三中將各第二尺度塊進行合并得到第三尺度塊時,依次遍歷各第二尺度塊,將未經(jīng)合并的當前第二尺度塊作為第三尺度塊,并將滿足第二既定條件的未經(jīng)合并的第二尺度塊合并到所述第三尺度塊。
所述第二既定條件為第三尺度塊與相鄰的第二尺度塊在豎直方向有既定高度的交疊;且第三尺度塊與相鄰的第二尺度塊的水平間距大于零、小于等于2倍第二參考水平間距。
所述步驟三還包括對得到的第三尺度塊進行驗證,如果與當前第二尺度塊相鄰的、與合并方向相反的第二尺度塊和當前第二尺度塊在豎直方向有高度大于既定高度的交疊,且兩相鄰的第二尺度塊的水平間距不大于2倍水平間距,則當前第二尺度塊不能合并至第三尺度塊中,當前第三尺度塊結束合并。
所述步驟四中的延長線分別由位于第三尺度塊中最左側既定數(shù)目的第一尺度塊和最右側的既定數(shù)目的第一尺度塊生成,通過提取各第一尺度塊的中心點坐標用最小二乘法擬合得到。
所述步驟四中的既定數(shù)目為三個及三個以上。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司,未經(jīng)漢王科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010568411.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





