[發明專利]一種圖像文檔關鍵圖案的提取方法無效
| 申請號: | 201010225300.1 | 申請日: | 2010-07-13 |
| 公開(公告)號: | CN101894154A | 公開(公告)日: | 2010-11-24 |
| 發明(設計)人: | 房斌;陳睿;文靜;唐遠炎 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/52 |
| 代理公司: | 重慶市前沿專利事務所 50211 | 代理人: | 余錦曦 |
| 地址: | 400044 重*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 文檔 關鍵 圖案 提取 方法 | ||
技術領域
本發明涉及一種關鍵圖案的提取方法,尤其設計一種字跡文檔圖像關鍵詞提取技術領域。
背景技術
從手寫字跡文檔圖像中提取關鍵詞是一項重要的任務,它能夠作為文本相關筆跡鑒別的預處理步驟,其實質是從數字圖像中識別和定位目標物體。目標物體識別一般通過將目標物體模型的特征和數字圖像中的檢測到的實體的特征進行匹配的方式實現。學術界提出了大量基于整體和局部方法的能夠抗旋轉和位移的目標物體識別和定位的技術。整體方法基于整體特征,如邊界和區域。這些方法包括不變矩、Fourier描述子和互相關。局部方法使用局部特征,包括關鍵點、局部最大曲率和多邊形近似。
Hough變換是檢測直線、圓和其它解析曲線的有效方法,它把目標的識別問題轉化為對在參數空間投票多少的判定。
現有技術的缺點是:最初的Hough變換只能用來檢測形狀有解析表達式的目標。為了檢測形狀任意的、沒有解析表達式的目標,人們提出了廣義Hough變換(GHT)算法。GHT的實質也是讓輪廓邊界點進行投票,只是投票地點不是由表達式的參數確定,而是定義一個參考點和一套投票機制,通過投票的集中程度來判定目標的存在與否。
GHT解決了任意形狀邊界目標的識別,但它的缺點是:需要目標物體的完整輪廓邊界點信息,難以從字跡文檔圖像中提取所有有效的關鍵詞,難以可靠實現書寫者身份鑒別。
發明內容
本發明的目的是提供一種圖像文檔關鍵圖案的提取方法,利用改進的廣義Hough變換從手寫漢字文檔圖像中提取關鍵詞,能夠可靠實現書寫者身份的鑒別。
為達到上述目的,本發明表述一種圖像文檔關鍵圖案的提取方法,其關鍵在于按以下步驟進行:
一種圖像文檔關鍵圖案的提取方法,其關鍵是按以下步驟進行:
一、獲取源圖像文檔,并對在源圖像文檔進行二值化和骨架化處理,獲得處理圖像M,并在處理圖像M中確定所要查閱的關鍵圖案,并以其中一個關鍵圖案作為模板S,模板S的長a和寬b由人工確定;
二、確定模板S的重心,在模板S中確定每個像素點在該模板S中的鄰域方向角基準特征X’、重心夾角基準特征Y’和重心距離基準特征Z’,并用這些基準特征建立參考表;
三、采集處理圖像M中每個圖案像素的鄰域方向角特征X,將每個圖案像素的鄰域方向角特征X與所述鄰域方向角基準特征X’進行比較,找出與鄰域方向角基準特征X’鄰域方向角相匹配的匹配圖案像素D;
四、引用參考表中的重心夾角基準特征Y’和重心距離基準特征Z’,并投射到所述匹配圖案像素D上,用該匹配圖案像素D的重心夾角和重心距離,在處理圖像M中對關鍵圖案的重心進行虛擬關鍵圖案還原投票,定位出圖像文檔中所有的真實關鍵圖案。
所述像素點鄰域方向角的獲取方法為:
第一步:確定圖案像素點A的邊長為r的正方形,其鄰域是以點A為中心,邊長為r的文檔圖像的子圖像;
第二步:統計該子圖像周邊的鄰域邊界點,將相鄰的邊界點組成N個集合,即鄰域邊界點集;
第三步:以圖案像素點A所在橫軸正方為鄰域方向角起始邊,按逆時針旋轉,每個鄰域邊界點集中點與圖案像素點A的連線為鄰域方向角終止邊,獲取每個鄰域邊界點集的方向角,其范圍是[0,360);
第四步:統計出圖案像素A所有鄰域邊界點集的方向角,即該圖案像素點A的N個圖案像素鄰域方向角。
所述每個圖案像素在模板S中的重心夾角為:對于模板S中的每個字符像素橫軸正方向和它與模板S重心連線構成的向量V沿逆時針方向所成夾角為重心夾角,即從橫軸正方向開始,按逆時針方向旋轉到V所經過的角度,其范圍是[0,360)。
所述每個圖案像素在模板S中的重心距離為:每個字符像素點到模板S重心的距離長度。
所述模板S重心為:該模板S中所有像素點X向坐標和的平均值,所有像素點Y向坐標和的平均值。
所述參考表為:鄰域方向角基準特征X’、重心夾角基準特征Y’和重心距離基準特征Z’,其中鄰域方向角基準特征X’包含N個值,它們構成了參考表中的一行;
在匹配過程中,對文檔圖像中的每個字符像素點提取N個鄰域方向角特征,用這些方向角與參考表中每一行的對應方向角的值進行比較,如果匹配度大于設定閾值,則在文檔圖像中用重心夾角和重心距離進行虛擬關鍵圖案還原投票,最終根據票數在參數空間中形成局部峰值,定位出真實關鍵圖案的位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010225300.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種空間行波管收集極輻射散熱器
- 下一篇:一種氨基酸葉面肥
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





