[發明專利]用于非規范格式手寫中文地址的識別方法有效
| 申請號: | 201510044955.1 | 申請日: | 2015-01-29 |
| 公開(公告)號: | CN104598887B | 公開(公告)日: | 2017-11-24 |
| 發明(設計)人: | 呂岳;韋簫華;呂淑靜 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/68 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙)31215 | 代理人: | 徐筱梅,張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 規范 格式 手寫 中文 地址 識別 方法 | ||
1.一種用于非規范格式手寫中文地址的識別方法,其特征在于該方法包括以下步驟:
步驟1:構建詞級樹,用以表示并存儲規范書寫格式的地址;所述構建詞級樹的深度為5,第1層為根節點,從第2層至第5層分別存儲表示“省”,“市”,“區”及“路”名的地址詞,其中每個節點存儲一個地址詞;
步驟2:構建字符索引表,用以表示單個字符和地址詞之間的關聯;所述構建字符索引表用于存儲所有被包含在地址詞中的字符,并且將字符與包含此字符的所有地址詞進行關聯;
步驟3:分割-識別處理,用于對圖像進行字符的分割,合并及對分割塊合并所成的候選模式塊進行字符識別;具體包括:
圖像過分割,將圖像分割成原子塊,用于將手寫漢字之間的重疊部分或連筆部分分割開;
合并分割塊,將連續的原子分割塊逐一進行合并形成候選模式塊,用于恢復過分割過程造成的單個字符或是左右結構的字符被分離開的情況;
字符識別,用于識別候選模式塊,并計算識別結果置信度;
步驟4:生成候選地址詞,用于得到置信度較高的候選地址詞;所述生成候選地址詞是通過結合候選模式識別結果,字符索引表以及詞級樹所存儲的地址詞,對詞級樹進行修剪而得;
步驟5:規范格式地址識別,用于將待識別手寫地址映射到所對應的規范格式書寫的方式;所述規范格式地址識別是將候選地址詞結合詞級樹,對詞級樹采用至底向上的搜索方法對候選地址詞進行組合,最終生成候選地址;取置信度最高的候選地址作為最終的地址識別結果。
2.如權利要求1所述的識別方法,其特征在于所述圖像過分割通過采用連通元分析,歸一化重疊度計算及投影分析對圖像進行過分割并最終得到一系列原子分割塊。
3.如權利要求1所述的識別方法,其特征在于所述字符識別還包括:
手寫字符分類器,用于對候選模式塊進行分類;
置信度轉換,用于對識別結果進行置信度的計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510044955.1/1.html,轉載請聲明來源鉆瓜專利網。





