[發明專利]基于循環神經網絡的數字助聽器聲場識別算法及實現方法有效
| 申請號: | 202010173180.9 | 申請日: | 2020-03-13 |
| 公開(公告)號: | CN111491245B | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 陳霏;韓悅 | 申請(專利權)人: | 天津大學 |
| 主分類號: | H04R25/00 | 分類號: | H04R25/00;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 天津市三利專利商標代理有限公司 12107 | 代理人: | 韓新城 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 循環 神經網絡 數字 助聽器 聲場 識別 算法 實現 方法 | ||
1.基于循環神經網絡的數字助聽器聲場識別算法,其特征在于,包括步驟:
S1.通過全相位濾波器組對音頻進行濾波分析,該濾波器組按人耳聽覺特征將輸入音頻劃分為16通道,然后對音頻進行計算提取16維特征值;
步驟S1的具體步驟如下:
S11.樣本分段:
以一定的采樣速率對音頻采樣,獲得L個樣點,然后分段處理,生成各個子分段X(k-N+1,k-N+2,…,k+N-1),其中N=256,k=N,N+1,…,L-N,X包含2N-1個樣點;
S12.確定長度為N的目標頻率向量H;
根據bark域轉換公式確定bark域范圍,對bark域進行通道數量均分得到一系列bark域等距點,再由Bark域最小頻率得到bark域各頻帶范圍;根據逆變換公式f=((bark+0.53)*1960)/(26.28-bark)計算線性頻帶分布,進而確定濾波器組的頻率向量H;
S13.計算濾波器系數向量hi;
對頻率向量H進行IFFT得到hi=[h(0)h(1)…h(N-1)]T,i=1,2,…,16.按照FIR濾波器構造方式將hi擴展為長度2N-1的系數,即hi=[hi(0),hi(1),…,hi(N-1),hi(1),…,hi(N-1)];
S14.雙窗全相位濾波處理:
用長度為N的前窗f、后窗b進行卷積得到卷積窗win,然后對卷積窗win歸一化處理,w(m)=win(m)/max(win(m)),m=-N+1,…,N-1;
S15.計算濾波器組抽頭系數h1i:將卷積窗w(k)與濾波器系數向量hi相乘,取前256個系數作為抽頭系數h1i,h1i=[h(0),h(1),…,h(N-1)];
S16.濾波輸出計算:
將2N-1個X按抽頭系數相等的樣本點進行相加,然后將X與濾波器組抽頭系數h1i進行相乘累加,即得到一個通道濾波器的輸出;對于序列長度為L的音頻數據,經過16通道濾波器組處理后輸出16×L的音頻數據;一個通道濾波器的輸出為
S17.特征值計算:對序列長為L的16通道音頻分段進行特征值計算,得到16維特征值;
式中,yi(n)為單個通道的輸出語音,xi為特征值;
S2.將16維特征值輸入至三層循環神經網絡進行特征分類,得到聲場環境分類的結果;
步驟S2的具體步驟如下:
S21.將得到的16維特征值xi輸入第一層神經網絡,該層為全連接層,激活函數為relu,節點數為16;訓練完畢的全連接層提供16×16維權值以及16個節點的偏置值,則經過第一層全連接層處理后的輸出為:
S22.將第一層全連接層16節點輸出值qi入到第二層神經網絡,該層為GRU層,激活函數為sigmoid和tanh,節點數為16;訓練完畢的GRU層提供權值和偏置值,GRU層處理的計算過程為:
hi(t)=(1-zi(t))×hi(t-1)+zi(t)×h′i(t)
式中,w表示權值,b表示偏置值,
S23.將上一步的GRU層輸出值輸入至第三層神經網絡,該層為全連接層,激活函數為softmax,節點數為5,最后輸出對應的聲場類型;其計算過程為:
S3.根據不同的聲場環境相應地調整助聽器的特性參數。
2.基于循環神經網絡的數字助聽器聲場識別算法的硬件實現方法,其特征在于,包括:
設置全相位濾波器組進行特征提取的提取,以及設置由三層循環神經網絡模塊構成的特征識別模塊以進行特征的識別;
所述全相位濾波器分為輸入模塊,參數模塊,濾波計算模塊,控制模塊,合成輸出模塊,特征值計算模塊;
輸入模塊,用于對輸入的音頻數據進行緩存,然后根據控制模塊輸出的地址,通過數據選擇器選擇系數相等的序列點輸入濾波計算模塊進行計算;
參數模塊,用于存儲全相位濾波器組16個通道的抽頭系數;
滲濾計算模塊,采用4個全相位濾波器并行的計算結構,完成16個通道需要復用4次該結構;單個濾波器包括一個對系數相同的輸入數據進行相加的加法器,完成相加結果與濾波器組抽頭系數相乘的乘法器以及最后進行累加的加法器;在兩個加法器之后都插入了一級寄存器進行流水線設計;
控制模塊,用于負責向輸入音頻模塊和參數模塊提供讀地址,同時控制著輸入音頻和抽頭次數的讀取,也負責向輸出模塊提供寫地址并控制輸出模塊的寫入;
合成輸出模塊,用于將各通道輸出語音相加合成后輸出;
特征值計算輸出模塊,用于對全相位濾波器組輸出的16通道音頻進行特征值計算;
所述特征識別模塊分為特征識別參數模塊,特征識別控制模塊、第一全連接層計算模塊、GRU層計算模塊、第二全連接層計算模塊;
特征識別模塊的三層RNN的參數模塊內存儲著三層神經網絡計算所需的所有權值和偏置參數,所述參數由在Tensorflow平臺將三層RNN訓練完畢后得到,硬件實現時存儲在RAM內,在RNN進行計算時根據提供的地址向計算模塊提供對應的權值和偏置參數;
第一層全連接層計算模塊和第二層全連接層計算模塊的計算單元相同,包括一個乘法器和一個加法器,在乘法器和加法器之后都插入了一級寄存器進行流水線設計;所述GRU層計算模塊,包括兩個乘法器與一個加法器,在乘法器和加法器之后分別插入一級寄存器進行流水線設計;
該特征識別控制模塊,用于控制特征識別參數模塊的讀取,負責向特征識別參數模塊提供計算模塊所需參數的地址,同時負責計算模塊的計算使能,累加次數控制及清零控制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010173180.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種植物品種DUS測試方法
- 下一篇:船舶設計圖紙的設繪方法和系統





