[發明專利]基于多分辨自動編碼器的光學符號識別方法在審
| 申請號: | 202110301000.5 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN112818978A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 金立左;許歆逸;張向向;閻俊 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 薛雨妍 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分辨 自動 編碼器 光學 符號 識別 方法 | ||
1.一種基于多分辨自動編碼器的光學符號識別方法,其特征在于:提出了一種用于無監督特征學習的擬孿生神經網絡(Quasi-Siamese Network);該網絡包括多分辨特征提取和無監督特征學習兩個關鍵處理模塊,能夠自動學習輸入圖像的多分辨特征,包括如下步驟:
步驟1,光學符號圖像隨機采樣及預處理;
步驟2,光學符號圖像多分辨特征提取;
步驟3,構建無監督特征學習網絡;
步驟4,構建損失函數并訓練網絡,迭代搜索最優參數;
步驟5,提取測試圖像特征,引入分類識別網絡進行分類識別。
2.根據權利要求1所述的一種基于多分辨自動編碼器的光學符號識別方法,其特征在于:步驟1中,對光學符號圖像進行隨機采樣及預處理;對輸入圖像X進行隨機分塊采樣,分塊大小為(s×s),樣本總量為N,采樣結果記作對采樣結果進行ZCA(Zero-phaseComponent Analysis)白化,通過降低特征之間的相關性,減少輸入數據中的信息冗余,經過ZCA白化后的結果記作
3.根據權利要求1所述的一種基于多分辨自動編碼器的光學符號識別方法,其特征在于:步驟2中,對光學符號圖像進行多分辨特征提取;對步驟1中隨機采樣結果獲取其在一定帶寬b、尺度S和方向O條件下的Gabor特征隨后,基于倒金字塔格式的采樣布局,以不同的空間采樣率對圖像塊上相應尺度的Gabor特征進行均勻采樣,獲取大尺度特征對小尺度特征感受野充分覆蓋的多分辨特征
4.根據權利要求1所述的一種基于多分辨自動編碼器的光學符號識別方法,其特征在于:步驟3中,構建用于無監督特征學習的擬孿生神經網絡;以降噪自動編碼器為主分支,以單層前饋神經網絡為副分支,構造擬孿生神經網絡;向步驟1中隨機采樣結果加入高斯噪聲,作為主分支降噪自動編碼器的輸入,先進行編碼,得到編碼結果再進行解碼,得到解碼結果將步驟2中提取的對應圖像塊上多分辨特征作為副分支單層前饋神經網絡的輸入,進行編碼,得到編碼結果
5.根據權利要求1所述的一種基于多分辨自動編碼器的光學符號識別方法,其特征在于:步驟4中,構建用于優化擬孿生神經網絡的損失函數;損失函數分為三部分:
第一部分,以步驟3中主分支降噪自動編碼器的解碼結果與未加噪輸入之間的L2距離為重構特征項;
第二部分,以主分支降噪自動編碼器的隱含層輸出,即編碼結果與副分支單層前饋神經網絡的編碼結果的L1距離為相似度量項;
第三部分,以副分支單層前饋神經網絡隱含層輸出的稀疏性為正則化項;
利用上述三部分構建多分辨自動編碼器無監督特征學習的損失函數,使用誤差反向傳播算法訓練擬孿生神經網絡,獲得兩個分支的權值參數。
6.根據權利要求1所述的一種基于多分辨自動編碼器的光學符號識別方法,其特征在于:步驟5中,對輸入的測試圖像Xtest,以和步驟1中相同的分塊大小(s×s)進行充分采樣,得到采樣結果使用訓練完備的擬孿生神經網絡主分支降噪自動編碼器進行編碼,并將編碼結果按圖像塊的空間位置進行排列,得到編碼結果隨后,通過最大池化,對特征映射進行降維,將幅值低于指定閾值的編碼置零后,獲得最終的測試圖像特征F;將測試圖像特征F直接送入多層感知機(MLP)或支持向量機(SVM)等分類器進行光學符號的分類識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110301000.5/1.html,轉載請聲明來源鉆瓜專利網。





