[發明專利]一種基于高頻聲波短時傅里葉變換的手寫字母識別方法有效
| 申請號: | 201910018087.8 | 申請日: | 2019-01-09 |
| 公開(公告)號: | CN109657739B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 湯戰勇;李青佩;翟雙姣;范天賜;王煥廷;房鼎益;龔曉慶;陳峰 | 申請(專利權)人: | 西北大學 |
| 主分類號: | G06F18/24 | 分類號: | G06F18/24;G06F18/214;G06N3/0464;G06N3/08;G01S7/539 |
| 代理公司: | 西安恒泰知識產權代理事務所 61216 | 代理人: | 李婷 |
| 地址: | 710069 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 高頻 聲波 傅里葉變換 手寫 字母 識別 方法 | ||
1.一種基于高頻聲波短時傅里葉變換的手寫字母識別方法,其特征在于,包括以下步驟:
步驟1,收集訓練數據
在手機上設置有訓練數據收集模塊,用于發射調制好的高頻聲音信號,同時收錄用戶書寫英文字母時所述高頻聲音信號的反射信號;高頻聲音信號的調制方法為:
步驟1.1,選擇13位Barker碼作為基帶信號,13位Barker碼表示為:
s=[-1,-1,-1,-1,-1,1,1,-1,-1,1,-1,1,-1]
步驟1.2,將兩個所述的13位Barker碼連接后,再補14個0,使其長度為40,記為S1;
步驟1.3,對S1進行12次上采樣,得到長度為480的S2,將S2調制到頻率為19kHz的正弦波上,表示為:
signal=S2·cos(2πfct)
其中,t表示時間,fc表示載波頻率,fs表示采樣率;
步驟1.4,使用帶通濾波器去除signal信號其他頻率上的噪聲,只留下17kHz-21kHz的高頻聲波信號;
步驟1.5,將濾波后的signal信號保存成wav格式,訓練數據收集模塊通過播放wav格式的signal信號發射高頻聲音信號;
步驟2,訓練網絡模型
步驟2.1,讀取步驟1中得到的wav文件,對其進行短時傅里葉變換;
提取wav文件中信號的頻譜矩陣S和功率譜矩陣P,以及時間分割向量T和頻率分割向量F,繪制(T,F,(P./abs(S)))三者之間關系的STFI圖;
步驟2.2,將步驟2.1中得到的STFI圖進行裁剪,只留下17kHz-21kHz的頻率段的頻譜圖;
步驟2.3,對步驟2.2中裁剪后的頻譜圖進行灰度處理,使得3通道的彩色圖像轉換為單通道的灰度圖像;
步驟2.4,對步驟2.3處理后的頻譜圖進行歸一化處理,處理過程為:img=(im-mean(im))/255,其中im為步驟2.3灰度處理后的頻譜圖數據,img為歸一化處理后的數據;
步驟2.5,建立CNN模型
第1層為2D卷積層,第2層為MaxPooling2D池化層,第3層是2D卷積層,第4層是MaxPooling2D池化層,第5層是Dropout,第6-8層是2D卷積層,第9層是MaxPooling2D池化層,第10層是Dropout,第11層為Flatten層,將數據拉成1維;第12層是全連接層,第13層是Dropout,第14層是全連接層,第15層是Dropout,最后一層是使用softmax作為激活函數的全連接層;
步驟2.6,將步驟2.4處理得到的數據作為步驟2.5建立的CNN模型的輸入,同時輸入數據對應的標簽,訓練該CNN模型,并將訓練好的CNN模型保存;
步驟2.7,使用步驟2.6得到的CNN模型提取Flatten層的數據作為SVM分類器的輸入,訓練SVM分類器模型,存儲訓練好的分類器模型;
步驟3,識別階段
步驟3.1,使用步驟1的方法獲取用戶寫字母時候的數據,然后使用步驟2.1-2.4的方法對數據進行處理;
步驟3.2,將步驟3.1得到的數據作為步驟2.6的輸入,使用步驟2.6得到的CNN模型提取新數據的Flatten特征,通過步驟2.7保存的分類器模型來識別所寫的英文字母。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北大學,未經西北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910018087.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:字符識別方法、裝置、設備及存儲介質
- 下一篇:資產管理信標及系統





