[發明專利]一種基于最大穩定極值區域與筆畫寬度的文本定位方法有效
| 申請號: | 201710299524.9 | 申請日: | 2017-05-02 |
| 公開(公告)號: | CN107045634B | 公開(公告)日: | 2020-07-21 |
| 發明(設計)人: | 崔國龍;陳樹東;黎明;熊丁丁;黃華賓;曾冬冬;顧欽;孔令講 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/36 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 張楊 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 最大 穩定 極值 區域 筆畫 寬度 文本 定位 方法 | ||
1.一種基于最大穩定極值區域與筆畫寬度相結合的鐵路場景文本定位方法,具體包括如下步驟:
S1.采集待檢圖像,將數字攝像采集裝置固定于車輛前視擋風玻璃上,視角平行于地面,持續采集待檢圖像;
S2.圖像預處理:將待檢圖像轉換成灰度圖,采用局部直方圖均衡化算法對灰度圖像進行對比度增強;
S3.獲取全圖的最大穩定極值區域:通過對步驟S2獲得的圖像用0到255的變化閾值分別進行二值化,在閾值變化過程中,有一些區域會在一定范圍的閾值變化中保持穩定,這些穩定的區域就是最大穩定極值區域;經過上述操作只能檢測出暗文本區域,對原圖進行反轉后再檢測一次MSER,檢測出亮文本區域;
S4.初步形成字符候選區域:
步驟4.1:對步驟S3得到的最大穩定極值區域標記一個外接的檢測框,根據檢測框的大小和連通區域的占有率去除明顯不是字符的區域,連通區域的占有率表示連通區域面積與該連通區域外接檢測框面積的比值;
步驟4.2:去重復檢測框:若兩個檢測框的左上角坐標接近,檢測框尺寸也接近,則認為這兩個區域重復,任意去除一個;
步驟4.3:去除具有包含關系的檢測框:若兩個區域具有包含關系,則將大面積檢測框保留,到此留存的檢測框內的區域為字符候選區域;
S5.獲取筆畫寬度圖像:提取出各字符候選區域的骨架圖像,對骨架圖像進行距離變換得到筆畫寬度圖像;
S6.筆畫特征過濾:利用筆畫寬度和骨架端點數目來濾除非文本區域;
S7.文本行生成:鐵路號牌文本只有兩個方向:水平方向和垂直方向,通過并行的文本行生成策略將相鄰的文本連接起來得到文本行;
步驟7.1:將整個原圖像劃分為若干行,按照候選區域中心點橫坐標位置從左至右依次提取出屬于第1,2行的候選區域;
步驟7.2:對兩兩相鄰的候選區域從左至右依次判斷是否符合水平文本行關聯規則,得出所有相鄰候選區的判斷結果,將判斷為文本行的相鄰候選區進行組合輸出;
步驟7.3:按照步驟7.2相同的方法輸出劃分圖像第2、3行中的文本行;依次類推,直到遍歷完整張圖像,至此完成水平文本行的提取;
步驟7.4:再將整個原圖像劃分為若干列,按照候選區域中心點縱坐標位置從上至下依次提取出屬于第1,2列的候選區域;
步驟7.5:對兩兩相鄰的候選區域從上至下依次判斷是否符合垂直文本行關聯規則,得出所有相鄰候選區的判斷結果,將判斷為文本行的相鄰候選區進行組合輸出;
步驟7.6:按照步驟7.5相同的方法輸出劃分圖像第2、3列中的文本行;依次類推,直到遍歷完整張圖像,至此完成垂直文本行的提取;
S8.步驟S7判斷完成后輸出的文本行中會有重復的文本行,將重復的文本行刪除,得到原始圖像中文本行的最終結果;
其特征在于步驟S7中判斷水平/垂直的相鄰候選區域是否為文本行的方法為:
1)相鄰候選區的檢測框中心點橫/縱坐標的距離是否小于規定閾值;
2)相鄰候選區的檢測框的高度/寬度的差值是否小于規定閾值;
3)相鄰候選區的距離是否小于規定閾值;
4)相鄰候選區中前景的筆畫寬度的均值和平均灰度值的差值是否小于閾值;
滿足上述所有條件則認為相鄰區域為文本行。
2.如權利要求1所述的一種基于最大穩定極值區域與筆畫寬度相結合的鐵路場景文本定位方法,其特征在于所述步驟S5的具體方法為:
步驟5.1:獲取字符候選區域的灰度圖像,對灰度圖像進行二值化,二值化的方法為將字符候選區域的前景像素點的位置賦值為0,背景像素點的位置賦值為255;
步驟5.2:在二值圖的基礎上,遍歷值為0的像素點,與兩側背景像素點距離最近或相等的點即為骨架中心點,從而獲取候選區域骨架圖像;
步驟5.3:獲取候選區域筆畫寬度圖像的方法:在二值圖中尋找出骨架中心p到與其最近的背景像素點q的歐式距離||p-q||,將數值2||p-q||替換圖像前景中射線qp經過的每個像素點的灰度值,遍歷整個骨架圖像,獲得該候選區域的筆畫寬度圖像。
3.如權利要求1所述的一種基于最大穩定極值區域與筆畫寬度相結合的鐵路場景文本定位方法,其特征在于所述步驟S6的具體方法為:
步驟6.1:利用筆畫寬度變異系數濾除非文本區域;
筆畫寬度的變異系數可以用來度量筆畫寬度變化的大小,其定義為筆畫寬度的標準差與均值的比值:
式中的meansw是在筆畫寬度圖像中求得的筆畫寬度的均值,N是筆畫寬度圖像中前景像素的個數,xi是圖像中某一點像素的筆畫寬度;由于一個連通區域內文本的筆畫寬度都會保持穩定,varsw值越小就表示筆畫寬度的變化越小,此區域是文本的概率就越高;
步驟6.2:根據骨架圖像的端點數目濾除非文本區域;
骨架端點的判斷方法為:遍歷每一個骨架中心像素,若該像素的八鄰域中只有一個連通像素點則認為它是筆畫端點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710299524.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于監測構件的方法
- 下一篇:發光單元和基于三角測量的測距裝置





