[發明專利]一種文檔曲面校正方法及裝置在審
| 申請號: | 202010172453.8 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111353961A | 公開(公告)日: | 2020-06-30 |
| 發明(設計)人: | 郭豐俊;李亞東;龍騰 | 申請(專利權)人: | 上海合合信息科技發展有限公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/13;G06K9/32;G06K9/38 |
| 代理公司: | 上海恒銳佳知識產權代理事務所(普通合伙) 31286 | 代理人: | 殷曉雪 |
| 地址: | 200433 上海市楊*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文檔 曲面 校正 方法 裝置 | ||
1.一種文檔曲面校正方法,其特征是,包括如下步驟:
步驟S10:對文檔圖像進行角點定位及透視校正;
步驟S20:在文檔圖像中檢測文字行;
步驟S30:提取文字行特征,由分類器將文檔圖像分為I類版式和II類版式兩類;I類版式的文檔圖像進入步驟S40,II類版式的文檔圖像進入步驟S50;
步驟S40:對I類版式的文檔圖像采用I類校正方法;
步驟S50:對II類版式的文檔圖像采用II類校正方法。
2.根據權利要求1所述的文檔曲面校正方法,其特征是,所述步驟S10中,文檔角點定位方法包括基于直線檢測、基于輪廓提取、基于跳變點檢測的任一種。
3.根據權利要求2所述的文檔曲面校正方法,其特征是,所述步驟S10中,采用基于直線檢測的角點定位方法,具體包括如下步驟;
步驟S11:檢測文檔圖像的邊緣,得到文檔圖像的邊緣圖;
步驟S12:在邊緣圖上做直線檢測;
步驟S13:組合四條直線形成四邊形,對所有四條直線組合根據邊緣響應強度、角度、邊長中的一項或多項進行篩選,最終得到文檔的角點。
4.根據權利要求1所述的文檔曲面校正方法,其特征是,所述步驟S10中,對文檔圖像進行角點定位之后,根據文檔角點坐標對文檔圖像做透視校正,并裁剪出文檔區域。
5.根據權利要求1所述的文檔曲面校正方法,其特征是,所述步驟S20中,采用基于輪廓提取的文字行檢測方法,具體包括如下步驟;
步驟S21:對文檔圖像做二值化,并做反色操作,得到二值圖;對二值圖做橫向膨脹,以將文字行連接在一起;然后做豎向腐蝕,去除圖像中線段的干擾;
步驟S22:在步驟S21處理后的圖片上找連通域,根據連通域的特征將連通域分類為文字區域和非文字區域兩種;
步驟S23:將文字區域的連通域進行組合,拼接,得到最終文字行。
6.根據權利要求5所述的文檔曲面校正方法,其特征是,所述步驟S22中,分類的規則包括如下一種或多種:連通域包圍四邊形寬度大于預設最小寬度,連通域包圍四邊形高度小于預設最大高度,連通域包圍四邊形寬高比大于預設最小寬高比。
7.根據權利要求5所述的文檔曲面校正方法,其特征是,所述步驟S23中,組合、拼接具體包括如下步驟;
步驟S231:循環遍歷所有連通域組合,判斷是否將兩個連通域組成連通域對;
步驟232:遍歷所有連通域對,根據連通域對的信息,采用鏈表數據結構對連通域進行拼接組成連通域序列,重復步驟S231至步驟S232得到多個連通域序列;
步驟233:遍歷連通域序列,若連通域序列的x軸方向長度大于預設最小長度,則對該連通域序列做離散采樣,作為一個文字行。
8.根據權利要求7所述的文檔曲面校正方法,其特征是,所述步驟S231中,判斷規則包括如下一種或多種:兩個連通域在x軸方向的重疊長度大于預設最小長度,兩個連通域主方向之間的角度差小于預設最大角度,一個連通域上的中心點與過另一連通域中心點主方向的直線的距離小于預設最大距離。
9.根據權利要求7所述的文檔曲面校正方法,其特征是,所述步驟S233中,文字行的處理形式為一組散點序列;采樣方式為按照預設間隔對連通域序列在x軸方向采樣,該采樣位置的y軸坐標設為連通域序列包圍范圍內y軸坐標的平均值,即若當前采樣位置的x軸坐標為xi,則y軸坐標定義為公式一,其中,Pxy定義為公式二;
10.根據權利要求1所述的文檔曲面校正方法,其特征是,所述步驟S30中,提取的文字行特征包括以下一項或多項:所有文字行的平均長度、所有文字行的長度中位值、所有文字行左邊界x軸坐標的平均值、所有文字行左邊界x軸坐標的中位值、所有文字行右邊界x軸坐標的平均值、所有文字行右邊界x軸坐標的中位值,長度大于圖像寬度的一定比例的文字行中y軸坐標的最小值與最大值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海合合信息科技發展有限公司,未經上海合合信息科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010172453.8/1.html,轉載請聲明來源鉆瓜專利網。





