[發明專利]語音喚醒方法、裝置、電子設備和計算機可讀存儲介質在審
| 申請號: | 202210946385.5 | 申請日: | 2022-08-08 |
| 公開(公告)號: | CN115312040A | 公開(公告)日: | 2022-11-08 |
| 發明(設計)人: | 成莎莎;趙德欣;沈浩;楊杰;李曉宇 | 申請(專利權)人: | 中國電信股份有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/16;G10L15/22;G10L17/02;G10L17/04;G10L17/18 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 孫寶海 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 喚醒 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
1.一種語音喚醒方法,其特征在于,包括:
根據預先訓練的神經網絡模型對待識別語音的語譜圖進行處理,得到所述待識別語音的聲紋特征向量和喚醒詞;
根據預設的對應關系表,查詢與所述喚醒詞對應的注冊喚醒詞標簽,并根據所述注冊喚醒詞標簽,得到注冊特征向量;
根據所述聲紋特征向量和所述注冊特征向量,計算向量相似度;
在所述向量相似度大于預設的閾值的情況下,進行語音喚醒。
2.根據權利要求1所述的語音喚醒方法,其特征在于,在根據預先訓練的神經網絡模型對待識別語音的語譜圖進行處理,得到所述待識別語音的聲紋特征向量和喚醒詞之前,所述方法還包括:
獲取注冊語音的語譜圖;
根據預先訓練的神經網絡模型對所述注冊語音的語譜圖進行處理,得到注冊特征向量和注冊喚醒詞標簽;
根據所述注冊特征向量和所述注冊喚醒詞標簽構建所述對應關系表。
3.根據權利要求1所述的語音喚醒方法,其特征在于,在根據預先訓練的神經網絡模型對待識別語音的語譜圖進行處理,得到所述待識別語音的聲紋特征向量和喚醒詞之前,所述方法還包括:
去除待識別語音中的靜默音,得到有效待識別語音;
當所述有效待識別語音的有效音頻時長大于或等于預設的時長閾值時,對所述有效待識別語音進行處理,得到所述待識別語音的語譜圖。
4.根據權利要求3所述的語音喚醒方法,其特征在于,所述方法還包括:
當所述有效待識別語音的有效音頻時長小于預設的時長閾值時,語音喚醒失敗。
5.根據權利要求1所述的語音喚醒方法,其特征在于,所述根據預先訓練的神經網絡模型對待識別語音的語譜圖進行處理,得到所述待識別語音的聲紋特征向量和喚醒詞之前,所述方法還包括:
將待識別語音分割成多個時長為第一時長的語音文件,所述語音文件的幀長為第二時長、幀移為第三時長;
將所述語音文件轉化為語譜圖。
6.根據權利要求2所述的語音喚醒方法,其特征在于,在根據預先訓練的神經網絡模型對待識別語音的語譜圖進行處理,得到所述待識別語音的聲紋特征向量和喚醒詞之前,所述方法還包括:
對獲取到的語音數據集進行處理,得到所述語音數據集的語譜圖;
根據所述語音數據集的語譜圖和對應的標簽,訓練初始神經網絡模型,其中,所述初始神經網絡模型包括第一目標網絡結構和第二目標網絡結構,若滿足預設的第一訓練停止條件,則將所述初始神經網絡模型作為目標神經網絡模型。
7.根據權利要求6所述的語音喚醒方法,其特征在于,所述語音數據集的語譜圖包括用于模型訓練的訓練數據集和用于驗證模型的測試數據集,所述訓練數據集和所述測試數據集按照預設比例劃分。
8.根據權利要求6所述的語音喚醒方法,其特征在于,所述第一訓練停止條件包括訓練損失小于第一閾值或訓練輪數大于第二閾值。
9.根據權利要求6所述的語音喚醒方法,其特征在于,所述語音數據集的語譜圖還包括驗證數據集;
所述第一目標網絡結構和第二目標網絡結構通過以下方式得到:
基于多梯度下降算法MGDA算法構建訓練損失函數;
根據所述訓練數據集、帶有網絡結構參數的初始網絡結構和所述訓練損失函數,固定所述網絡結構的網絡結構參數,通過訓練獲得網絡操作權重;
基于MGDA算法構建驗證損失函數;
固定所述網絡操作權重,根據所述驗證數據集和所述驗證損失函數,通過訓練獲得新的網絡結構參數,以得到過程網絡結構;
計算語音喚醒詞識別和聲紋識別梯度,得到公共梯度下降方向的更新共享參數,重新進行訓練,直至滿足預設的第二訓練停止條件,得到目標網絡結構,所述目標網絡結構包括所述第一目標網絡結構和第二目標網絡結構中的一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電信股份有限公司,未經中國電信股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210946385.5/1.html,轉載請聲明來源鉆瓜專利網。





