[發明專利]一種拍攝小票圖像文本矯正和提取方法在審
| 申請號: | 201910018095.2 | 申請日: | 2019-01-09 |
| 公開(公告)號: | CN109871844A | 公開(公告)日: | 2019-06-11 |
| 發明(設計)人: | 蔣光峰;葉樺 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/46 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 張偉 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 矯正 文本行 邊緣像素 圖像文本 小線段 掩模圖 角點 預處理 四邊 邊線 閉合區域 二值圖像 位置合成 文本識別 紙張顏色 新文本 拍攝 檢出 擬合 像素 拼接 連通 匹配 膨脹 圖像 應用 | ||
1.一種拍攝小票圖像文本矯正和提取方法,其特征在于,包括以下步驟:
提取小票邊緣像素,根據紙張顏色去除非小票像素,得到小票像素的掩模圖,由此提取小票的邊緣像素;
通過概率霍夫變換找到小票輪廓線段;
將線段分成上下左右4類;
對線段進行拼接,調整線段端點,使小的為起點,大的為終點,將所有線段按照起點排序,排序后去除重復線段,對長度有重合的線段進行合并、重組,再通過延長、平移將邊線補齊,最后連接四邊邊線,形成閉合區域;
計算角點,根據相鄰線段的斜率差查找左右邊線角點,匹配角點,通過角點將小票圖像分成多個子圖;
子圖矯正,通過透視變換依次將畸變的子圖拉正;
文本行檢測,對二值圖像進行膨脹,將左右文字連通,使用最小外接矩形框包圍單行文本連通區域,去除非文本行,檢出文本行;
合成新文本圖像,對所有傾斜的文本行進行傾斜矯正,按文本行框在原圖位置按照上下、左右順序合成新文本圖像。
2.根據權利要求1所述的一種拍攝小票圖像文本矯正和提取方法,其特征在于:所述步驟(4)中線段拼接后調整邊線與文本距離,使其不碰到文字,且不出紙面。
3.根據權利要求1所述的一種拍攝小票圖像文本矯正和提取方法,其特征在于,所述步驟(5)中角點匹配,一個左角點需要有一個右角點進行匹配,若當前右角點未匹配到左角點,則去掉此右角點;若當前左角點未匹配到右角點,則去掉此左角點。
4.根據權利要求1所述的一種拍攝小票圖像文本矯正和提取方法,其特征在于,所述步驟(5)中角點匹配完成后,微調角點上下位置,使左右角點連線避免切到文本。
5.根據權利要求1所述的一種拍攝小票圖像文本矯正和提取方法,其特征在于,所述步驟(7)中圖像膨脹方向為水平方向。
6.根據權利要求1所述的一種拍攝小票圖像文本矯正和提取方法,其特征在于,所述步驟(7)中去除非文本行的方法如下:統計平均行高,去除行高大于1.5倍或小于0.5倍平均行高的行,這些矩形框是LOGO圖案等非文本行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910018095.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:字符識別方法和裝置、用于字符識別的裝置
- 下一篇:證件圖像提取方法及終端設備





