[發明專利]一種金融票據大寫金額處手寫漢字的分割方法有效
| 申請號: | 202011160188.8 | 申請日: | 2020-10-27 |
| 公開(公告)號: | CN112016566B | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 張振彬;劉貫偉;王偉;張云峰;安增花;武艷紅 | 申請(專利權)人: | 恒銀金融科技股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/20;G06T7/11;G06T7/136;G06T7/194 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300308 天津市濱海新*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 金融 票據 大寫 金額 手寫 漢字 分割 方法 | ||
本發明公開了一種金融票據大寫金額處手寫漢字的分割方法,其特征在于,包括以下步驟:選取大寫金額處手寫漢字區域;利用大律法計算圖像最佳分割閾值:遍歷圖像灰度值并求和取平均值,得到初步分割的閾值,遍歷閾值從0到255,每次遍歷需計算前景和背景的方差值,當方差值取得最大時,判定前景和背景的差異最大,此時得到的閾值為最佳分割閾值;利用最佳分割閾值對圖像進行二值化,得到手寫體漢字和背景分割的二值化圖像;橫向投影計算漢字平均高度;縱向投影確定最優寬度序列;利用平均高度及最優寬度序列分割大寫金額處手寫漢字。
技術領域
本發明涉及薄片類紙質介質處理領域,特別是涉及一種金融票據處的大寫金額處手寫體漢字的分割方法。
背景技術
目前,在字符處理領域內,手寫體漢字分割和識別技術發展迅猛,其識別準確率正在逐步提升,應用場景日益不斷拓展,其相關產品也日漸趨于成熟,但在金融票據上大寫金額處的特定識別場景下的應用效果并不理想。
不同于其他漢字手寫體應用場景,金融票據上大寫金額漢字種類較少,有壹 、貳、叁、肆、伍、陸、柒等共約20個,由于手寫區域長度的限制,漢字相互貼近、粘連的情況很普遍,且漢字手寫時字體風格因人而異,字號大小不一致,連筆、亂筆等現象頻繁出現,這使得精確分割出字符變得十分困難。
發明內容
本發明的目的是針對現有技術中存在的技術缺陷,而提供一種金融票據大寫金額處手寫漢字的分割方法,
為實現本發明的目的所采用的技術方案是:
一種金融票據大寫金額處手寫漢字的分割方法,其特征在于,包括以下步驟:
選取大寫金額處手寫漢字區域;
利用大律法計算圖像最佳分割閾值:遍歷圖像灰度值并求和取平均值,得到初步分割的閾值,遍歷閾值從0到255,每次遍歷需計算前景和背景圖象的方差值,當方差值取得最大時,判定前景和背景的差異最大,此時得到的閾值為最佳分割閾值;
利用最佳分割閾值對圖像進行二值化,得到手寫體漢字和背景分割的二值化圖像;
橫向投影計算漢字平均高度;
縱向投影確定最優寬度序列;
利用平均高度及最優寬度序列分割大寫金額處手寫漢字。
作為優選的,得到初步分割的閾值后,分別計算前景和背景的點數、質量矩、平均灰度,得到前景和背景圖象的方差值。
作為優選的,前景和背景圖象的方差值計算公式如下:
g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1) 公式1
其中:g是前景和背景的方差值;w0是前景像素點數占圖像總像素數的比例值;u0是前景中的平均灰度;w1是背景像素點數占圖像總像素數的比例值,u1是背景中的平均灰度;u是圖像的總平均灰度。
作為優選的,圖像的總平均灰度的計算公式如下:
u=w0*u0+w1*u1 公式2。
作為優選的,對二值化圖像進行橫向投影,計算每行漢字區所占像素點個數,以行像素點數作為限定條件,排除干擾點,得到有效連續的行數,即為漢字平均高度。
作為優選的,使用漢字平均高度值截取橫向投影圖像,再對其進行縱向投影,得到垂直方向上各列有效像素點個數,即初步的寬度序列。
作為優選的,針對初步的寬度序列,采用近似間隔的方法來確定漢字的最優寬度序列,包括如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒銀金融科技股份有限公司,未經恒銀金融科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011160188.8/2.html,轉載請聲明來源鉆瓜專利網。





