[發明專利]一種文字識別方法、裝置及計算機可讀存儲介質有效
| 申請號: | 201911177163.6 | 申請日: | 2019-11-26 |
| 公開(公告)號: | CN111046754B | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 馬文偉;劉設偉;沈程秀;閆永澤 | 申請(專利權)人: | 泰康保險集團股份有限公司;泰康在線財產保險股份有限公司 |
| 主分類號: | G06V30/414 | 分類號: | G06V30/414;G06V30/416;G06V30/42;G06V30/148;G06V30/162 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100031 北京市西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 識別 方法 裝置 計算機 可讀 存儲 介質 | ||
1.一種文字識別方法,其特征在于,所述方法包括:
對待識別的橢圓形印章圖像進行二值化處理,得到二值圖像;
檢測所述二值圖像中位于同一條直線上的第一文字序列;
根據所述二值圖像中的文字的連線所組成的第一橢圓與所述第一文字序列的位置關系,從所述第一文字序列中確定呈直線型分布的文字序列,包括:
將所述二值圖像中的文字進行區域連通,得到多個連通區域;確定所述多個連通區域的中心點,并根據所述中心點的連線確定第一橢圓;若所述第一橢圓與所述第一文字序列存在交叉點,則將位于所述交叉點的文字從所述第一文字序列中去除,得到呈直線型分布的文字序列;若所述第一橢圓與所述第一文字序列不存在交叉點,則將所述第一文字序列確定為呈直線型分布的文字序列;
根據所述二值圖像中的第二橢圓的長軸與水平線的夾角將所述第二橢圓設置到水平狀態;所述第二橢圓為所述橢圓形印章所對應的橢圓;
分別對所述呈直線型分布的文字序列、呈彎曲型分布的文字序列中的文字進行識別,所述呈彎曲型分布的文字序列包括所述呈直線型分布的文字序列之外的文字。
2.根據權利要求1所述的方法,其特征在于,在分別對所述呈直線型分布的文字序列、所述呈彎曲型分布的文字序列中的文字進行識別之前,還包括:
確定所述呈直線型分布的文字序列的縱坐標,得到第一縱坐標;
確定所述第二橢圓的中心點的縱坐標,得到第二縱坐標;
若所述第一縱坐標大于所述第二縱坐標,則將所述二值圖像旋轉至所述呈直線型分布的文字序列中的文字處于正立狀態。
3.根據權利要求1所述的方法,其特征在于,在對待識別的橢圓形印章圖像進行二值化處理之前,還包括:
基于RGB顏色空間,或,基于RGB顏色空間和CMYK顏色空間對待識別的橢圓形印章圖像進行圖像增強。
4.根據權利要求3所述的方法,其特征在于,所述基于RGB顏色空間對待識別的橢圓形印章圖像進行圖像增強,包括:
對于所述橢圓形印章圖像中的每個像素點,確定所述像素點的R分量、G分量、B分量之間的方差,得到方差矩陣;
基于所述方差矩陣對待識別的橢圓形印章圖像進行圖像增強。
5.根據權利要求4所述的方法,其特征在于,所述基于RGB顏色空間和CMYK顏色空間對待識別的橢圓形印章圖像進行圖像增強,包括:
對于所述橢圓形印章圖像中的每個像素點,確定所述像素點的R分量與G分量的差值,得到差值矩陣;
在CMYK顏色空間上確定所述橢圓形印章圖像的M分量,得到M分量矩陣;
根據所述方差矩陣、所述差值矩陣、所述M分量矩陣確定目標矩陣;
基于所述目標矩陣對待識別的橢圓形印章圖像進行圖像增強。
6.一種文字識別裝置,其特征在于,所述裝置包括:
二值化處理模塊,用于對待識別的橢圓形印章圖像進行二值化處理,得到二值圖像;
檢測模塊,用于檢測所述二值圖像中位于同一條直線上的第一文字序列;
直線序列確定模塊,用于根據所述二值圖像中的文字的連線所組成的第一橢圓與所述第一文字序列的位置關系,從所述第一文字序列中確定呈直線型分布的文字序列,包括:
區域連通子模塊,用于將所述二值圖像中的文字進行區域連通,得到多個連通區域;
中心點確定子模塊,用于確定所述多個連通區域的中心點,并根據所述中心點的連線確定第一橢圓;
直線序列確定第一子模塊,用于若所述第一橢圓與所述第一文字序列存在交叉點,則將位于所述交叉點的文字從所述第一文字序列中去除,得到呈直線型分布的文字序列;
直線序列確定第二子模塊,用于若所述第一橢圓與所述第一文字序列不存在交叉點,則將所述第一文字序列確定為呈直線型分布的文字序列;
水平設置模塊,用于根據所述二值圖像中的第二橢圓的長軸與水平線的夾角將所述第二橢圓設置到水平狀態;所述第二橢圓為所述橢圓形印章所對應的橢圓;
文字識別模塊,用于分別對所述呈直線型分布的文字序列、呈彎曲型分布的文字序列中的文字進行識別,所述呈彎曲型分布的文字序列包括所述呈直線型分布的文字序列之外的文字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泰康保險集團股份有限公司;泰康在線財產保險股份有限公司,未經泰康保險集團股份有限公司;泰康在線財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911177163.6/1.html,轉載請聲明來源鉆瓜專利網。





