[發明專利]一種基于RNN聚合方式的聲紋識別方法與系統有效
| 申請號: | 202010326716.6 | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111354364B | 公開(公告)日: | 2023-05-02 |
| 發明(設計)人: | 陳華官;張志齊 | 申請(專利權)人: | 上海依圖網絡科技有限公司 |
| 主分類號: | G10L17/18 | 分類號: | G10L17/18;G10L17/02 |
| 代理公司: | 上海市匯業律師事務所 31325 | 代理人: | 唐嘉偉 |
| 地址: | 200233 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 rnn 聚合 方式 聲紋 識別 方法 系統 | ||
1.一種基于RNN聚合方式的聲紋識別方法,其特征在于,包括以下步驟:
獲取原始音頻;
抽取所述原始音頻中的原始頻譜特征;
從所述原始頻譜特征中獲得特征層;
將所述特征層輸入RNN中聚合,輸出RNN中的隱藏狀態特征;
將所述隱藏狀態特征進行說話人分類;所述特征層由所述原始頻譜特征經過二維卷積神經網絡進行抽取;所述特征層為F×N特征層,其中F是頻率方向的維度,N是時間方向的維度;
所述聚合可替換地包括以下步驟:
將所述F×N特征層輸入單向RNN中,所述單向RNN中包含一個或多個RNN單元,將最后一個RNN單元的所述隱藏狀態特征輸出;或者
將所述F×N特征層輸入雙向RNN中,所述雙向RNN中包含一個或多個RNN單元,將最后一個RNN單元的所述隱藏狀態特征輸出;或者
對所述F×N特征層按照時間維度方向算平均池化得出平均特征X;將所述平均特征X復制N遍后與所述F×N特征層連接,輸入所述RNN中;取出最后一個所述RNN單元的所述隱藏狀態特征與所述平均特征X連接后輸出。
2.如權利要求1所述的一種基于RNN聚合方式的聲紋識別方法,其特征在于,將所述隱藏狀態特征通過批量梯度下降法進行說話人分類。
3.如權利要求1所述的一種基于RNN聚合方式的聲紋識別方法,其特征在于,將所述隱藏狀態特征通過隨機梯度下降法進行說話人分類。
4.如權利要求1所述的一種基于RNN聚合方式的聲紋識別方法,其特征在于,將所述隱藏狀態特征通過小批量梯度下降法進行說話人分類。
5.一種基于RNN聚合方式的聲紋識別系統,其特征在于,所述系統包括:
音頻采集模塊,用于獲取原始音頻;
頻譜特征獲取模塊,用于抽取所述原始音頻中的原始頻譜特征數據;
特征層獲取模塊,用于根據所述原始頻譜特征數據進行特征層的抽取;
聚合模塊,用于將所述特征層輸入RNN中進行聚合并輸出RNN中的隱藏狀態特征;
說話人分類模塊,用于對所述隱藏狀態特征進行說話人分類;
所述特征層由所述特征層獲取模塊根據所述原始頻譜特征經過二維卷積神經網絡進行抽取;
所述特征層為F×N特征層,其中F是頻率方向的維度,N是時間方向的維度;
所述聚合模塊為單向導入聚合模塊,用于將所述F×N特征層輸入單向RNN中進行聚合并輸出最后一個RNN單元的所述隱藏狀態特征,所述單向RNN中包含一個或多個RNN單元;或者
所述聚合模塊為雙向導入聚合模塊,用于將所述F×N特征層輸入雙向RNN中進行聚合并輸出最后一個RNN單元的所述隱藏狀態特征,所述雙向RNN中包含一個或多個RNN單元;或者
所述聚合模塊內置有平均池化模塊與復制模塊;所述平均池化模塊用于對所述F×N特征層按照時間維度方向算平均池化得出平均特征X;所述復制模塊用于將所述平均特征X復制N遍,隨后通過所述聚合模塊與F×N特征層連接,輸入所述RNN中進行聚合,取出最后一個所述RNN單元的所述隱藏狀態特征與所述平均特征X連接后輸出。
6.如權利要求5所述的一種基于RNN聚合方式的聲紋識別系統,其特征在于,所述說話人分類模塊內置有執行模塊,所述執行模塊內置有批量梯度下降法程序,所述執行模塊被處理器控制執行將所述隱藏狀態特征通過批量梯度下降法進行說話人分類。
7.如權利要求5所述的一種基于RNN聚合方式的聲紋識別系統,其特征在于,所述說話人分類模塊內置有執行模塊,所述執行模塊內置有隨機梯度下降法程序,所述執行模塊被處理器控制執行將所述隱藏狀態特征通過隨機梯度下降法進行說話人分類。
8.如權利要求5所述的一種基于RNN聚合方式的聲紋識別系統,其特征在于,所述說話人分類模塊內置有執行模塊,所述執行模塊內置有小批量梯度下降法程序,所述執行模塊被處理器控制執行將所述隱藏狀態特征通過小批量梯度下降法進行說話人分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海依圖網絡科技有限公司,未經上海依圖網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010326716.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:動子總成和直線電機
- 下一篇:用于表面電感芯自動組裝接合的生產線





