[發明專利]一種基于神經網絡的圖像識別方法在審
| 申請號: | 201610810458.2 | 申請日: | 2016-09-08 |
| 公開(公告)號: | CN106997473A | 公開(公告)日: | 2017-08-01 |
| 發明(設計)人: | 汪潤春;譚黎敏 | 申請(專利權)人: | 汪潤春 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/06 |
| 代理公司: | 上海隆天律師事務所31282 | 代理人: | 臧云霄,鐘宗 |
| 地址: | 澳大利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 圖像 識別 方法 | ||
1.一種基于神經網絡的圖像識別方法,其特征在于,包括以下步驟:
S101、多類神經網絡學習圖片樣本:所述多類神經網絡包括大量的神經元,將多個帶有字符的圖片樣本以及背景圖片樣本分別提供給所述神經元進行學習,所述多類神經網絡針對所述圖片樣本生成若N類標簽,所述標簽至少包括一個代表背景的標簽、若干代表阿拉伯數字的標簽和/或若干代表英文字母的標簽,每個所述圖片樣本對應所述標簽中的一類;
S102、訓練所述多類神經網絡辨識圖片樣本:將多個帶有字符的圖片樣本以及背景圖片樣本分別提供給所述神經網絡進行訓練,根據所述多類神經網絡匯總對于所有訓練樣本的權值,并將所述權值作為所述神經網絡的匹配參數;
S103、通過不同卷積窗的尺寸針對待測試圖片進行多尺度卷積測試:在同一尺寸的卷積窗卷積測試中,將每一次的卷積窗內對應的局部所述待測試圖片輸入到所述圖像識別神經網絡,通過神經網絡運算得到一個N*1的一維輸出矩陣,將所述一維輸出矩陣中的最大值作為代表每個所述卷積窗的置信度,所述最大值所對應的標簽作為所述卷積窗的標簽,隨著卷積窗會逐步位移,依次掃描整張待測試圖片,以此將每個所述卷積窗映射到代表該卷積窗在待測試圖片中位置的二維矩陣中得到一個最大值矩陣和一個標簽矩陣;
S104、將多種卷積窗尺寸下的標簽矩陣進行結合:將多種不同卷積窗尺寸通過所述卷積測試得到的最大值標簽矩陣投影到同一個平面矩陣,然后將所述平面矩陣中所有代表相同字符且位置相近的點的集合認為其預測的是同一個字符,作為一簇,并且不斷地將簇之間距離小于卷積窗的長度或是寬度的一半的點歸為該簇,將簇之間距離大于卷積窗的長度或是寬度的一半的點歸為新的一簇,從而計算出所有簇的中心坐標;以及
S105、將所述簇中累計權重最高的標簽或是將置信度最高的標簽輸出作為唯一的標簽。
2.如權利要求1所述的基于神經網絡的圖像識別方法,其特征在于:所述步驟S101中,在N類標簽中,將每個帶有字符的圖片樣本的標簽設為大于0的不同整數數值,而所述背景圖片樣本的標簽設為-1。
3.如權利要求2所述的基于神經網絡的圖像識別方法,其特征在于:帶有單個阿拉伯數字字符的所述圖片樣本的標簽是0至9中的一個;帶有單個英文字母字符的所述圖片樣本的標簽是11至36中的一個。
4.如權利要求1所述的基于神經網絡的圖像識別方法,其特征在于:所述標簽還包括若干代表中文字符的標簽、若干日文字符的標簽、若干韓文字符的標簽、若干法文字符的標簽以及若干俄文字符的標簽。
5.如權利要求1所述的基于神經網絡的圖像識別方法,其特征在于:所述步驟S102中所述背景圖片樣本的總數量大于等于所述帶有字符的圖片樣本的總數量。
6.如權利要求5所述的基于神經網絡的圖像識別方法,其特征在于:基于已有的所述圖片樣本進行仿射變換以及背景替換來合成新的所述圖片樣本,來增加該類所述圖片樣本的數量。
7.如權利要求1所述的基于神經網絡的圖像識別方法,其特征在于:所述步驟S103中,所述卷積窗在所述二維矩陣的X軸代表該卷積窗在所述待測試圖片中的橫向位置,Y軸代表該卷積窗在所述待測試圖片中的縱向的位置。
8.如權利要求7所述的基于神經網絡的圖像識別方法,其特征在于:在同一尺寸的卷積窗卷積測試中通過將每個所述卷積窗的最大值映射到代表該卷積窗在待測試圖片中位置的二維矩陣中得到一個對應待測試圖片的最大值矩陣;
并且,還通過將每個所述卷積窗的標簽映射到代表該卷積窗在待測試圖片中位置的二維矩陣中得到一個對應待測試圖片的標簽矩陣。
9.如權利要求1所述的基于神經網絡的圖像識別方法,其特征在于:所述步驟S103中,分別通過20*20、24*24、以及28*28三個卷積窗的尺寸分別進行三次卷積測試。
10.如權利要求1所述的基于神經網絡的圖像識別方法,其特征在于:所述步驟S103中,分別通過24*24、28*28、以及32*32三個卷積窗的尺寸分別進行三次卷積測試。
11.如權利要求1所述的基于神經網絡的圖像識別方法,其特征在于:所述步驟S103中,分別通過20*20、24*24、28*28、32*32以及36*36五個卷積窗的尺寸分別進行五次卷積測試。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于汪潤春,未經汪潤春許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610810458.2/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





