[發明專利]一種形變表格結構識別方法在審
| 申請號: | 202210573606.9 | 申請日: | 2022-05-24 |
| 公開(公告)號: | CN114973283A | 公開(公告)日: | 2022-08-30 |
| 發明(設計)人: | 鐘婧婷;楊詞慧;葉小麗 | 申請(專利權)人: | 南昌航空大學 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06V30/164;G06V30/18 |
| 代理公司: | 南昌豐擇知識產權代理事務所(普通合伙) 36137 | 代理人: | 張榮 |
| 地址: | 330000 江*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 形變 表格 結構 識別 方法 | ||
1.一種形變表格結構識別方法,其特征在于,該方法包括以下步驟:
(1)圖像預處理;對輸入的含有表格的原始圖像I進行圖像增強、二值化及骨架提取,得到第一二值圖像I1;
(2)字符去除;采用字符去除算法將第一二值圖像I1中存在的大部分字符去除,得到第二二值圖像I2;然后進一步判斷像素點四個鄰接矩形區域中黑色像素點的個數,將第二二值圖像I2中的所有字符去除,得到第三二值圖像I3;
(3)角點定位;首先采用角點檢測算法對第三二值圖像I3中的角點進行檢測,得到第一角點集合P1;然后對第一角點集合P1中的角點進行聚類,得到第二角點集合P2;最后對第二角點集合P2中不符合條件的角點進行篩選,得到原始圖像I的角點集合P3;
(4)輪廓獲取;將第三二值圖像I3水平方向上寬度為1的像素刪除,獲取只保留水平線的第四二值圖像I4;獲取第四二值圖像I4中所有的輪廓Con1,Con2,...,Conβ,其中β為第四二值圖像I4中的輪廓總數;
(5)單元格定位;對角點集合P3中的所有角點進行分類,將角點集合P3中屬于輪廓的角點加入到點集其中得到角點集合然后根據角點集合point1,point2,...,pointβ中的每一個角點的位置,確定原始圖像I中每一個單元格的左上角頂點、右上角頂點、右下角頂點、左下角頂點的坐標,得到單元格坐標集合CP。
2.根據權利要求1所述的一種形變表格結構識別方法,其特征在于:上述步驟(1)中對輸入的含有表格的原始圖像I進行圖像增強、二值化及骨架提取,具體采用了以下方法:
(1.1)對輸入的原始圖像I采用圖像增強算法進行圖像增強,得到圖像增強結果圖像I01,然后采用圖像二值化算法對圖像增強結果圖像I01進行圖像二值化,得到圖像增強結果二值圖像I02;
(1.2)采用骨架提取算法對圖像增強結果二值圖像I02進行骨架提取,得到第一二值圖像I1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南昌航空大學,未經南昌航空大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210573606.9/1.html,轉載請聲明來源鉆瓜專利網。





