[發明專利]音頻質量綜合評測方法及系統有效
| 申請號: | 201811368468.0 | 申請日: | 2018-11-16 |
| 公開(公告)號: | CN109147765B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 鄭抗;李蘭影;胡尹;王金钖 | 申請(專利權)人: | 安徽聽見科技有限公司 |
| 主分類號: | G10L15/05 | 分類號: | G10L15/05;G10L15/26;G10L25/60 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 王立民;賈博雍 |
| 地址: | 230001 安徽省合肥市高新區*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 質量 綜合 評測 方法 系統 | ||
本發明公開了一種音頻質量綜合評測方法及系統,其中方法包括:接收待測音頻數據;對所述待測音頻數據進行語音識別,得到識別文本;分別從所述待測音頻數據和所述識別文本獲取質量評測特征,所述質量評測特征包括聲學特征和語義特征;利用所述質量評測特征以及預先訓練的音頻質量評測模型,對所述待測音頻數據進行評價,得到音頻質量評測結果。本發明通過分析音頻數據的聲學及語義兩個層面的信息,彌補了現有的評測方案標準單一的問題,在實際評測過程中不僅大大節省人工工作量,并且還具有較高的評價準確度,使得評價結果更為客觀、全面。
技術領域
本發明涉及自然語言理解及語音信號處理領域,尤其是一種音頻質量綜合評測方法及系統。
背景技術
語音識別被廣泛地應用在各種領域,如工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等。尤其是隨著深度神經網絡等新技術的應用以及硬件計算能力的飛速提升,語音識別的效率與效果都在逐年提升,因而在可預期的未來,語音識別必然會獲得更加廣泛的應用。
音頻作為語音識別系統的輸入,其質量好壞直接影響到語音識別的正確率,同時音頻質量對于語音識別模型訓練也起到至關重要的作用,所以有必要對音頻質量進行評測。但是音頻資源浩如煙海,完全用人工進行評價不切實際,同時音頻資源種類繁多,單一的評價特征往往不能得到全面可靠的評測結果。所以有必要提出一種音頻質量的自動評測方法及系統,能夠對大量、多類的音頻實現高效的自動評測,得到可靠的評測結果。
現有音頻質量評測方法一般包含主觀評測方法及客觀評測方法兩大類。主觀評測方法需要人工聽音頻數據給出主觀打分,所述人工一般為專家或專業人士,當音頻時長較長或者音頻較多時,人工評測的工作量較大,成本也較高,不具有實用性;客觀評測方法并不能完全地代替主觀質量評估,而是在盡量接近人類主觀感知的基礎上獲得一種既方便又能夠準確有效地預測音頻質量的方法。當前的客觀評測方法大都是提取語音信號的時域、頻域或變換域的特征參數,估計語音信號的質量,如頻譜、包絡、響度、回音和噪聲等,此類評估方法考慮因素單一,得到的評測結果不夠全面。
本發明的設計初衷是面向人類語音音頻,語音質量的好壞最后均會反映在終端受眾(人或非人)的接受度上,傳統的單純依靠聲學特征進行質量評測的方式忽略了語義層面對于質量評價結果的影響,由于無論是間接還是直接,最終的受眾仍會關注該段人類語音的清晰表達上,但“清晰表達”在某些容易被忽略的場景中包含了針對語義清楚的特定需求,當受眾能夠較容易地識別、理解音頻中的語義時,往往會提升對該音頻的正面評價。因此,對于音頻質量評價體系,將語義層面與聲學層面相結合的需求會具有超越傳統觀念的重要意義。
發明內容
針對上述需求,本發明的目的是提供一種音頻質量綜合評測方法及系統,綜合聲學及語義兩個維度評價音頻質量,以此獲得更為全面、客觀的評測結果。
本發明采用的技術方案如下:
一種音頻質量綜合評測方法,包括:
接收待測音頻數據;
對所述待測音頻數據進行語音識別,得到識別文本;
分別從所述待測音頻數據和所述識別文本獲取質量評測特征,所述質量評測特征包括聲學特征和語義特征;
利用所述質量評測特征以及預先訓練的音頻質量評測模型,對所述待測音頻數據進行評價,得到音頻質量評測結果。
可選地,
所述分別從所述待測音頻數據和所述識別文本獲取質量評測特征包括:
從所述待測音頻數據中獲取所述聲學特征,所述聲學特征包括:流暢度特征和/或完整性特征;
從所述識別文本中獲取語義特征,所述語義特征包括:語義置信度特征和/或語法準確性特征。
可選地,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽聽見科技有限公司,未經安徽聽見科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811368468.0/2.html,轉載請聲明來源鉆瓜專利網。





