[發明專利]一種基于塊投影的藏文歷史文獻文本區域提取方法有效
| 申請號: | 201710836675.3 | 申請日: | 2017-09-17 |
| 公開(公告)號: | CN107862310B | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 段立娟;張西群 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/32;G06K9/38;G06K9/46 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 劉萍 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 投影 藏文 歷史文獻 文本 區域 提取 方法 | ||
1.一種基于塊投影的藏文歷史文獻文本區域提取方法,其特征在于,包括以下步驟:
步驟1,采集數據;
通過掃描設備或拍照設備對藏文歷史文獻進行掃描或拍照,獲得藏文歷史文獻的圖像;
步驟2,數據預處理;
步驟2.1,光照均衡;
將采集到的藏文歷史文獻的圖像進行Gamma矯正,消除在獲取圖片的過程中產生的光照不均衡的影響;
步驟2.2,傾斜矯正;
將步驟2.1得到的藏文歷史文獻圖像進行灰度化處理;然后再利用基于Hough變換的傾斜矯正方法將圖像進行傾斜矯正;
步驟2.3,二值化;
利用Otsu算法,將步驟2.2得到的圖像進行二值化,得到藏文歷史文獻的二值化圖像;
步驟3,塊投影;
對二值化圖像中的連通區域進行分類;將二值化圖像均分為N*N的圖像塊,利用Harris算法檢測二值化圖像中的角點,并記錄每個圖像塊中角點的個數;
然后利用連通區域的分類信息和角點信息對均分為N*N的圖像塊進行過濾,計算過濾后圖像塊的垂直和水平投影;
步驟4,文本區域邊緣提取;
過濾后的圖像塊不但定位出近似的文本區域的位置,而且突出不同文本區域之間的間隔;通過分析塊投影,得到文本區域邊緣的近似位置;分析策略如下:
策略一:搜索圖像塊水平投影,找到水平投影兩端的第一個投影值從零到非零變化的點,分別表示為hb,he;把hb,he作為當前文檔圖像文本區域的近似水平起始位置和水平結束位置;
策略二:搜索圖像塊垂直投影,找到垂直投影的一對投影值從零到非零和從非零到零的變化點,分別表示為vb,ve;把vb,ve作為當前文檔圖像的一個文本區域的近似垂直起始位置和垂直結束位置;利用文本區域的近似水平、垂直起始和結束位置,由內向外搜索文本區域的四個邊的所有從文本類或背景像素變化為邊框像素的第一個像素點,記錄下來這些點,作為該文本區域的近似邊緣;如果搜索過程中,沒有搜索到像素點,則認為此處為斷裂部分,其邊緣像素點的縱或橫坐標用其相鄰的點的縱坐標或橫坐標填充;該文本區域的近似邊緣搜索完畢后,則從ve開始繼續搜索圖像塊的垂直投影,尋找下一個文本區域,直到搜索完圖像塊垂直投影;
通過策略一和策略二對塊投影的分析,被提取出了文本區域的邊緣;
步驟5,文本區域邊緣矯正;
對步驟4中得到的文本區域的近似邊緣進行矯正;矯正步驟如下:
以文本區域的上邊緣為例,說明矯正步驟;
步驟一:計算文本區域上邊緣點的縱坐標的平均值,表示為avo;
步驟二:從左至右搜索上邊緣的點,如果某個點的縱坐標與其前面的邊緣點的縱坐標的差大于bt,且此點的縱坐標大于avo,則此點的縱坐標用其前面的邊緣點的縱坐標代替;
對其他邊緣也按上述步驟做相應的矯正操作,然后根據矯正后的邊緣把缺失的點根據步驟4的搜索方式補全。
2.根據權利要求1所述的一種基于塊投影的藏文歷史文獻文本區域提取方法,其特征在于,步驟3所述塊投影包括以下步驟:
(1)連通區域分類;
利用八鄰域種子填充算法將二值化后圖像中的連通區域檢測出來,然后利用面積閾值和連通區域的長寬比或寬長比閾值對連通區域分為文本,邊框,線段;分類規則如下:
設圖像面積為S;面積閾值為a;長寬比或寬長比的閾值為r;
規則一:如果連通區域的面積大于a*S,此連通區域被分類為邊框;
規則二:如果連通區域的長寬比或寬長比小于r,此連通區域被分類為線段;
規則三:如果連通區域不滿足以上兩個規則,則此連通區域被分類為文本;
每個連通區域逐條匹配上述規則,匹配成功某條規則以后就結束,完成連通區域分類,a設為0.25,r的取值為0.05;
(2)角點檢測;
將二值化圖像均分為N*N的圖像塊,利用Harris算法檢測二值化圖像中的角點,并記錄每個圖像塊中角點的個數;
(3)圖像塊過濾;
利用連通區域的分類信息和角點密度信息過濾圖像塊;過濾規則如下:
設所有圖像塊中的最大的角點個數為MN,角點過濾閾值為bf;
規則一:如果圖像塊中的角點個數小于bf*MN,將圖像塊從保存列表中刪除;
規則二:如果圖像不塊滿足規則一,且圖像塊中包含大于等于兩個非文本類的連通區域,或者圖像塊是孤立的,或者圖像塊在圖像的邊緣且只包含非文本類連通區域;將圖像塊從保存列表中刪除;
規則三:如果圖像塊不滿足規則一、二,且圖像塊中包含文本類和非文本類連通區域,則調整圖像塊大小,只保存包含文本類的部分;
所有圖像塊逐條匹配以上規則,進行圖像塊的過濾,bf設為0.25;
(4)圖像塊投影;
利用過濾后的圖像塊,計算圖像塊的水平和垂直投影。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710836675.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鋰電池極片雙料帶高速模切機
- 下一篇:自動識別行車狀態的方法及其系統





