[發明專利]語音質量的評估模型、訓練評估方法、系統、設備及介質在審
| 申請號: | 202011380915.1 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112562724A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 朱城锜;羅超;胡泓 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/30;G10L25/60 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 楊東明;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 質量 評估 模型 訓練 方法 系統 設備 介質 | ||
本發明公開了一種語音質量的評估模型、訓練評估方法、系統、設備及介質,評估模型包括:端點檢測模塊,用于輸入待評估的音頻信號,并對音頻信號進行端點檢測得到第一音頻信號;預處理模塊,用于對第一音頻信號進行預處理得到語譜圖;特征提取模塊,用于提取語譜圖的特征;第一神經元,用于根據特征使用交叉熵損失函數判斷第一音頻信號是否為語音信號以得到加權系數;第二神經元,用于根據特征及加權系數使用誤差損失函數得到第一音頻信號的質量得分。本發明通過提取音頻信號的語譜圖,利用語音質量評估模型判斷出語音信號是否為語音,同時得的該語音信號的語音質量分數,在進行語音質量評估時不需要參考信號,評估過程更簡單。
技術領域
本發明涉及音頻技術領域,尤其涉及一種語音質量的評估模型、訓練評估方法、系統、設備及介質。
背景技術
電話一直以來都是重要的溝通方式,隨著網絡通訊的快速發展,網絡語音通信也成為了電話語音的一個重要組成部分。相比于公共交換電話網絡通訊,網絡協議通訊更容易受網絡可靠性影響,因此在當前情況下對電話語音質量評估變得尤為重要。
語音信號質量評估方法主要有兩類:人工主觀評估方法和有參考信號的客觀評估方法。人工主觀評估方法可推廣性較差而且無法保證通話隱私;有參考信號的客觀評估方法需要有參考信號,但是電話語音中難以得到參考信號。
發明內容
本發明要解決的技術問題是為了克服現有技術中有參考信號的客觀評估方法需要有參考信號、評估過程復雜的缺陷,提供一種語音質量的評估模型、訓練評估方法、系統、設備及介質。
本發明是通過下述技術方案來解決上述技術問題:
本發明提供一種基于神經網絡的語音質量的評估模型,包括
端點檢測模塊,用于輸入待評估的音頻信號,并對所述音頻信號進行有效音頻端點檢測得到第一音頻信號;
與所述端點檢測模塊的輸出連接的預處理模塊,用于對所述第一音頻信號進行預處理得到語譜圖;
與所述預處理模塊的輸出連接的特征提取模塊,用于提取所述語譜圖的特征;
與所述特征提取模塊的輸出連接的第一神經元,用于根據所述特征使用交叉熵損失函數判斷所述第一音頻信號是否為語音信號以得到加權系數;
與所述特征提取模塊的輸出連接的第二神經元,用于根據所述特征及所述加權系數使用誤差損失函數得到所述第一音頻信號的質量得分。
在本方案中,通過對輸入待評估的音頻信號進行語音端點檢測,找出語音的起始點和結束點,檢測出有用語音,去除無效語音,可以減少計算量和縮短處理時間,而且能排除無聲段的噪聲干擾、提高語音識別的正確率。因電話語音中存在非語音信號會降低評估分數的魯棒性,故采用多標簽模型的思想,基于音頻輸入,在判斷其是否為語音時,同時得到語音質量評估的得分。利用深度學習框架,提取音頻信號的短時頻域特征,利用多標簽模型,在損失函數上對二者進行約束,最后根據是否為語音信號得到加權系數,并對語音質量得分加權,實現了判斷當前音頻信號是否為語音的同時得到了語音信號的質量評分,在進行語音質量評估時不需要參考信號,評估過程更簡單。
優選地,所述特征提取模塊包括卷積層、GRU(門控循環單元)網絡和DNN(深度神經網絡)網絡;
所述卷積層、所述GRU網絡和所述DNN網絡依次連接;
所述卷積層用于提取所述語譜圖的初始特征;
所述GRU網絡用于記錄所述初始特征的歷史信息的影響并生成所述語譜圖的中間特征;
所述DNN網絡用于對所述中間特征進行整合以生成所述語譜圖的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011380915.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電桿臨時固定裝置
- 下一篇:一種空調裝置及控制方法





