[發明專利]中文繁體字識別方法及裝置、可讀存儲介質在審
| 申請號: | 202011028304.0 | 申請日: | 2020-09-26 |
| 公開(公告)號: | CN112163514A | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 李成范;胡子榮;顧善明;丁雪海;趙俊娟 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 上海梵恒知識產權代理事務所(普通合伙) 31357 | 代理人: | 李文鳳 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中文 繁體字 識別 方法 裝置 可讀 存儲 介質 | ||
1.一種中文繁體字識別方法,其特征在于,包括:
獲取待識別的圖片;
采用預設的繁體字識別神經網絡模型對所述待識別的圖片進行識別,并輸出識別出的繁體字;
所述繁體字識別神經網絡模型采用如下步驟生成:獲取包含多張樣本圖片的訓練樣本集,所述樣本圖片中包含有繁體字圖片;獲取樣本圖片對應的矩陣;將所述樣本圖片的矩陣輸入至初始神經網絡模型的卷積網絡中,獲取樣本圖片對應的卷積特征;將所述樣本圖片對應的卷積特征輸入至所述初始神經網絡模型的循環網絡層,得到樣本圖片中繁體字的文字序列特征;將所述文字序列特征輸入至CTC模型中,計算得到損失函數;根據所述損失函數對所述循環網絡層的參數w進行調整;當訓練次數達到預設次數時,得到所述繁體字識別神經網絡模型。
2.根據權利要求1所述的中文繁體字識別方法,其特征在于,所述卷積網絡包括7層卷積層和4層池化層,且第一池化層設置在第一卷積層與第二卷積層之間,第二池化層設置在所述第二卷積層與第三卷積層之間,第三池化層設置在所述第四卷積層與第五卷積層之間,第四池化層設置在第六池化層與第七池化層之間;
所述將所述樣本圖片的矩陣輸入至初始神經網絡模型的卷積網絡中,得到樣本圖片對應的卷積特征,包括:將所述樣本圖片的矩陣輸入至所述卷積網絡,依次經過7層卷積層和4層池化層后,得到所述樣本圖片對應的卷積特征;
其中,第i卷積層的輸出計算公式為:N1=(n–F+2P)/S+1,第j池化層的輸出計算公式為:N2=(n–F)/S+1;
其中,N1為第i層卷積層的輸出,1≤i≤7;N2為第j層池化層的輸出,1≤j≤4;F為濾波器的尺寸,P為填充值的大小,S為步長;n為前一層的輸入;第j池化層的激活函數為ReLU函數,且ReLU函數表達式如下:f(x)=max(0,N2)。
3.如權利要求2所述的中文繁體字識別方法,其特征在于,所述樣本圖片的大小為280*32像素。
4.如權利要求1所述的中文繁體字識別方法,其特征在于,所述將所述樣本圖片對應的卷積特征輸入至所述初始神經網絡模型的循環網絡層,得到樣本圖片中繁體字的文字序列特征包括:
將所述樣本圖片對應的卷積特征輸入至所述循環網絡層;
分別計算所述樣本圖片對應的卷積特征的正向序列特征和反向序列特征,并將所述正向序列特征與所述反向序列特征相加,將得到的和值作為所述樣本圖片中的繁體字的文字序列特征。
5.如權利要求4所述的中文繁體字識別方法,其特征在于,采用如下公式計算所述卷積特征的正向序列特征:s_t=f(Ux_t+W(s_t-1));
采用如下公式計算所述卷積特征的反向序列特征:s_t′=f(U′x_t+W′(s_t+1)′);
其中,U為所述卷積特征對應的輸入序列的第一權重矩陣,W為前一正向序列特征的權重矩陣,f為所述循環網絡層的隱藏層激活函數,x_t為所述卷積特征對應的輸入序列,U’為所述卷積特征對應的輸入序列的第二權重矩陣,W’為后一反向序列特征的權重矩陣。
6.如權利要求5所述的中文繁體字識別方法,其特征在于,采用如下公式計算所述樣本圖片中的繁體字的文字序列特征:
y=g(Vs_t+V′s_t′);其中,y為樣本圖片中的繁體字的文字序列特征,V為所述循環網絡層的輸出層的第一權重矩陣,g為輸出層激活函數,V’為所述循環網絡層的輸出層的第二權重矩陣。
7.如權利要求1所述的中文繁體字識別方法,其特征在于,所述將所述文字序列特征輸入至CTC模型中,計算得到損失函數,包括:
采用如下公式計算所述損失函數:
其中,x為輸入的所述文字序列特征,z為所述損失函數的輸出,L(S)為所述損失函數,S為x與z的集合,L(x,z)為求x與z的最大似然估計。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011028304.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有防傾倒功能的電動汽車充電樁
- 下一篇:一種環保型工藝品加工輔助裝置





