[發明專利]基于全卷積神經網絡的中文字符圖像筆劃提取方法、系統有效
| 申請號: | 201910454930.7 | 申請日: | 2019-05-29 |
| 公開(公告)號: | CN110232337B | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 劉成林;王鐵強 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 北京市恒有知識產權代理事務所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 中文 字符 圖像 筆劃 提取 方法 系統 | ||
1.一種基于全卷積神經網絡的中文字符圖像筆劃提取方法,其特征在于,該提取方法包括:
步驟S10,獲取中文字符圖像作為輸入圖像;
步驟S20,提取所述輸入圖像中字符筆劃的交疊區域圖;所述輸入圖像去除所述交疊區域部分為非交疊區域圖;
步驟S30,對所述交疊區域圖、非交疊區域圖進行骨架化操作,得到交疊區域骨架形態筆劃段集合、非交疊區域骨架形態筆劃段集合;
步驟S40,基于所述交疊區域骨架形態筆劃段集合,計算任意兩個筆劃段之間連貫度矩陣;所述連貫度矩陣中所有元素均大于或等于預設閾值的兩個筆劃段屬于同一筆劃;
步驟S50,將所述交疊區域中屬于同一筆劃的筆劃段相連,并將所述筆劃段與所述非交疊區域中直接相連的筆劃段合并成完整的骨架形態筆劃。
2.根據權利要求1所述的基于全卷積神經網絡的中文字符圖像筆劃提取方法,其特征在于,步驟S10中“獲取中文字符圖像作為輸入圖像”,其方法為:
獲取采集到的中文字符圖像,通過基于OTSU方法的全局二值化算法或局部自適應二值化算法,去除獲取的中文字符圖像的背景,得到中文字符圖像的前景圖像,并將該前景圖像作為輸入圖像。
3.根據權利要求1所述的基于全卷積神經網絡的中文字符圖像筆劃提取方法,其特征在于,步驟S20中“提取所述輸入圖像中字符筆劃的交疊區域圖;所述輸入圖像去除所述交疊區域部分為非交疊區域圖”,其方法為:
步驟S201,基于所述輸入圖像,通過交疊區域提取網絡收縮路徑提取所述輸入圖像的特征;
步驟S202,基于所述輸入圖像的特征,通過與交疊區域提取網絡收縮路徑對稱的擴張路徑進行逆向生成,獲取交疊區域圖;所述輸入圖像去除所述交疊區域部分為非交疊區域圖;
其中,所述交疊區域提取網絡為基于全卷積神經網絡構建的用于提取所述輸入圖像中字符筆劃的交疊區域圖的網絡。
4.根據權利要求1所述的基于全卷積神經網絡的中文字符圖像筆劃提取方法,其特征在于,步驟S40中“計算任意兩個筆劃段之間連貫度矩陣”,其方法為:
步驟S401,選取所述交疊區域骨架形態筆劃段集合中任意兩個筆劃段,分別記做;
步驟S402,在所述筆劃段上均勻選取N個點,分別記為集合
步驟S403,采用條件式全卷積網絡計算所述集合與中任意兩個點屬于同一筆劃的概率,獲得N×N個概率,構成筆劃段之間的連貫度矩陣。
5.根據權利要求3所述的基于全卷積神經網絡的中文字符圖像筆劃提取方法,其特征在于,步驟S30中“對所述交疊區域圖、非交疊區域圖進行骨架化操作”,其方法為:
通過骨架提取網絡進行所述交疊區域圖、非交疊區域圖的骨架化操作;所述骨架提取網絡,其訓練樣本的獲取方法為:
步驟B10,將聯機手寫字符的筆劃坐標點序列作為合成字符圖像的骨架,并設定筆劃寬度;
步驟B20,基于所述合成字符圖像的骨架,依據設定的筆劃寬度,將所述合成字符圖像的骨架擴張為有寬度的筆劃,得到合成字符圖像;所述合成字符圖像與其對應的骨架為所述骨架提取網絡的訓練樣本。
6.根據權利要求5所述的基于全卷積神經網絡的中文字符圖像筆劃提取方法,其特征在于,所述交疊區域提取網絡,其訓練樣本的獲取方法為:
基于合成字符圖像的筆劃坐標點序列信息,計算所述合成字符圖像對應的筆劃交疊區域;所述合成字符圖像與對應的筆劃交疊區域為所述交疊區域提取網絡的訓練樣本。
7.根據權利要求1所述的基于全卷積神經網絡的中文字符圖像筆劃提取方法,其特征在于,步驟S30中“得到交疊區域骨架形態筆劃段集合、非交疊區域骨架形態筆劃段集合”之后還設置有骨架形態筆劃段的優化步驟,其方法為:
計算所述字符筆劃交疊區域中每一個交疊區域的重心,獲取所述重心對應區域鄰接的所有骨架點,將交疊區域重心與鄰接骨架點在骨架圖中逐個連接,得到優化后的交疊區域骨架形態筆劃段集合;
基于所述字符筆劃非交疊區域,通過聚類的方法召回骨架像素點,得到優化后的非交疊區域骨架形態筆劃。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910454930.7/1.html,轉載請聲明來源鉆瓜專利網。





