[發明專利]一種用于版面分析中的連通區域提取方法及裝置無效
| 申請號: | 200810067409.X | 申請日: | 2008-05-23 |
| 公開(公告)號: | CN101290656A | 公開(公告)日: | 2008-10-22 |
| 發明(設計)人: | 朱慧瑩;鄒月嫻;吳天瑞;劉宏 | 申請(專利權)人: | 北京大學深圳研究生院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34 |
| 代理公司: | 深圳創友專利商標代理有限公司 | 代理人: | 郭曉芬 |
| 地址: | 518055廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 版面 分析 中的 連通 區域 提取 方法 裝置 | ||
技術領域
本發明涉及一種用于版面分析中的連通區域提取方法,本發明還涉及一種用于版面分析中的連通區域提取裝置。?
背景技術
如圖1所示,名片識別的流程一般依次包括輸入名片掃描圖像、預處理、版面分析、字符識別、后錄入處理和輸出。其中預處理包括將圖像二值化和分離文字、圖像;版面分析包括連通區域提取、連通區域合并、版面理解。其中,連通區域提取是版面分析中的一個非常重要的步驟。連通區域的提取就是從白色像素和黑色像素組成的二值化點陣圖像中,根據像素之間的連通性將相互連通的黑色像素集合或者白色像素集合提取出來,這些被提取出來的像素集合就是連通區域。?
像素之間的連通性是確定連通區域的一個重要的概念,其意義如下:假設目標像素p(x,y)的鄰域N(p)中有k個像素,對于這k個像素中任意第i個像素,如果其像素值和目標像素的像素值相同,則稱這兩個像素之間是相互連通的,即它們屬于同一連通區域。?
根據像素之間連通性的不同,可以有不同的連通區域提取方法。在圖像處理領域中,目前廣泛應用的是四連通處理方法和八連通處理方法。如圖2所示,四連通處理方法的基本原理如下:?
對于目標像素p(x,y),定義其鄰域N4(p)為:?
N4(p)={(x-1,y),(x+1,y),(x,y-1),(x,y+1)},對于和目標像素p(x,y)具有相同像素值的任意像素q(i,j),若q(i,j)在鄰域N4(p)中,則稱像素p(x,y)和像素q(i,j)相互連通,即它們屬于同一連通區域。?
八連通處理方法的基本原理如下:?
對于目標像素p(x,y),定義其鄰域N8(p)為:?
N8(p)=N4(p)+{(x-1,y-1),(x+1,y-1),(x-1,y+1),(x+1,y+1)}(其中,N4(p)={(x-1,y),(x+1,y),(x,y-1),(x,y+1)}),對于和目標像素p(x,y)具有相同像素值的任意像素q(i,j),若q(i,j)在鄰域N8(p)中,則稱像素p(x,y)和像素q(i,j)相互連通,即它們屬于同一連通區域。?
現有的四連通處理方法和八連通處理方法符合人類的認知邏輯,在大部分實踐中也能取得不錯的效果,因而得到了廣泛的應用。然而,這兩種處理方法缺少與具體應用相關聯的特殊性。在名片識別應用中,這兩種方法所提取的連通區域面積小,提取連通區域數目多,造成了后續連通區域合并計算復雜度高,并影響最終的版面分析效果。實驗證明這兩種方法在名片識別應用中不能獲得較好的連通域提取結果。而且,當前名片識別技術主要應用于手機等嵌入式平臺上,其系統硬件資源有限,算法計算復雜度高會導致系統處理速度慢,使人們難以忍受,從而降低系統的可用性。?
本發明所要解決的技術問題就是為了克服以上的不足,提出了一種用于版面分析中的連通區域提取方法及裝置,減少后續連通區域合并的復雜度。?
發明內容
本發明所要解決的技術問題就是為了克服以上的不足,提出了一種用于版面分析中的連通區域提取方法及裝置,減少后續連通區域合并的復雜度。?
為解決上述技術問題,本發明的方法,包括如下步驟:第一步:對于目標像素p(x,y),定義其鄰域N(p)為:?
N(p)={(x-1,y),(x+1,y),(x,y-1),(x,y+1),(x-1,y-1),(x+1,y-1),(x-1,y+1),(x+1,y+1),(x-4,y),(x-3,y),(x-2,y),(x+2,y),(x+3,y),(x+4,y),(x,y+2),(x,y-2)}?
第二步:對于和目標像素p(x,y)具有相同像素值的任意像素q(i,j),判斷q(i,j)是否在鄰域N(p)中,若是,則將像素p(x,y)和像素q(i,j)作為同一連通區域進行提取。?
優選地,所述第一步和第二步之間還包括如下步驟:?
(1)、從左至右、從上至下對名片的二值化點陣圖像進行像素標記;?
所述像素標記的方法為:如果目標像素p(x,y)為白色,則將目標像素標記為0;如果目標像素為黑色,則判斷目標像素的已掃描鄰域的標記是否都為0;如果不是都為0,則使目標像素跟隨已掃描鄰域中第一個掃描出的非0標記,如果是都為0,則給目標像素一個新的非0標記;?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學深圳研究生院,未經北京大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810067409.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:磁鐵嵌入式馬達
- 下一篇:氧化烯烴蠟傾點下降劑





