[發明專利]音頻質量綜合評測方法及系統有效
| 申請號: | 201811368468.0 | 申請日: | 2018-11-16 |
| 公開(公告)號: | CN109147765B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 鄭抗;李蘭影;胡尹;王金钖 | 申請(專利權)人: | 安徽聽見科技有限公司 |
| 主分類號: | G10L15/05 | 分類號: | G10L15/05;G10L15/26;G10L25/60 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 王立民;賈博雍 |
| 地址: | 230001 安徽省合肥市高新區*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 質量 綜合 評測 方法 系統 | ||
1.一種音頻質量綜合評測方法,其特征在于,包括:
接收待測音頻數據;
對所述待測音頻數據進行語音識別,得到識別文本;
分別從所述待測音頻數據和所述識別文本獲取質量評測特征,所述質量評測特征包括聲學特征和語義特征;其中,所述語義特征包括語法準確性特征,且獲取所述語法準確性特征包括:對識別文本中的語句進行語法修正,得到各語句的字符串編輯距離,計算字符串編輯距離與相應語句的句子長度的比值,將所述比值大于或等于預設比值閾值的語句標記為語法異常語句,將所述語法異常語句的數量占比作為所述語法準確性特征;
利用所述質量評測特征以及預先訓練的音頻質量評測模型,對所述待測音頻數據進行評價,得到音頻質量評測結果。
2.根據權利要求1所述的音頻質量綜合評測方法,其特征在于,
所述分別從所述待測音頻數據和所述識別文本獲取質量評測特征包括:
從所述待測音頻數據中獲取所述聲學特征,所述聲學特征包括:流暢度特征和/或完整性特征;
從所述識別文本中獲取語義特征,所述語義特征還包括:語義置信度特征。
3.根據權利要求2所述的音頻質量綜合評測方法,其特征在于,
從所述待測音頻數據中獲取所述流暢度特征的方法為:
根據所述待測音頻數據的響度異常狀態的占比,得到所述流暢度特征;
從所述待測音頻數據中獲取所述完整性特征的方法為:
根據所述待測音頻數據中的異常靜音的占比,得到所述完整性特征。
4.根據權利要求3所述的音頻質量綜合評測方法,其特征在于,
所述根據所述待測音頻數據的響度異常狀態的占比,得到所述流暢度特征具體包括:
設置固定時長的抽樣窗口;
通過所述抽樣窗口隨機且重復截取所述待測音頻數據的響度曲線;
根據每個所述抽樣窗口中的響度最大值和響度最低值,計算各所述抽樣窗口中的響度差;
將所述響度差大于或等于預設響度閾值的抽樣窗口標記為異常窗口;
將所述異常窗口的數量占比作為所述流暢度特征;
所述根據所述待測音頻數據中的異常靜音的占比,得到所述完整性特征具體包括:
獲取所述待測音頻數據中的各靜音段的持續時長;
將所述持續時長大于或等于預設時長閾值的靜音段標記為異常靜音段;
將所有異常靜音段的持續時長累加,得到異常靜音總時長;
將異常靜音總時長的占比作為所述完整性特征。
5.根據權利要求2所述的音頻質量綜合評測方法,其特征在于,
從所述識別文本中獲取所述語義置信度特征的方法為:
根據所述識別文本的單詞置信度計算語句置信度;
根據語句置信度計算所述識別文本的語義置信度特征。
6.根據權利要求5所述的音頻質量綜合評測方法,其特征在于,
從所述識別文本中獲取所述語義置信度特征的方法具體為:
以所述識別文本中的語句為單位,計算語句內各單詞的單詞置信度;
將一個語句內的單詞置信度的均值作為該語句的語句置信度;
計算語句置信度的均值,得到所述識別文本的語義置信度特征。
7.根據權利要求1~6任一項所述的音頻質量綜合評測方法,其特征在于,所述音頻質量評測模型的訓練方式包括:對所述音頻質量評測模型的音頻訓練樣本的音頻質量,按預設的主觀分級標準進行評測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽聽見科技有限公司,未經安徽聽見科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811368468.0/1.html,轉載請聲明來源鉆瓜專利網。





