[發明專利]基于音頻信號特性分類的無參考音頻質量評價方法和系統有效
| 申請號: | 201410196690.2 | 申請日: | 2014-05-09 |
| 公開(公告)號: | CN103957216B | 公開(公告)日: | 2017-10-03 |
| 發明(設計)人: | 胡瑞敏;楊玉紅;王衍業;謝松波;董少龍;余洪江;高麗;王曉晨;涂衛平;高戈 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L12/26;G10L25/60;G10L25/69 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙)42222 | 代理人: | 胡艷 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 音頻 信號 特性 分類 參考 質量 評價 方法 系統 | ||
技術領域
本發明涉及音頻質量評價領域,尤其涉及一種基于音頻信號特性分類的無參考音頻質量評價方法和系統。
背景技術
隨著人們生活質量提高,人們對音頻有了更高、更多樣化的需求,手機上移動音頻點播、音頻信息和音樂這樣的移動音頻服務正在快速增長,為了保證用戶在音頻服務上的良好體驗,音頻質量評價必不可少。音頻質量評價分為主觀質量評價和客觀質量評價,主觀質量評價雖然更能反映用戶體驗,但是費時、費力,也不適合實時傳輸,實際應用中往往采用客觀質量評價。客觀質量評價又分為有參考質量評價和無參考質量評價,有參考質量評價需要原始音作為參考,能夠較為準確預測音頻質量,但是實際通信時,特別是移動通信環境下,原始音往往不能夠獲得,此時,就需要無參考質量評價。
現有的無參考音頻質量評價都是通過統計網絡參數獲得,如丟包和延遲,最有代表性的是E-Model模型,但是均未考慮用戶對不同類型音頻信號感知失真的差異性。
發明內容
針對現有技術存在的不足,本發明提出了一種基于音頻信號特性分類的無參考音頻質量評價方法和系統,本發明方法和系統考慮了用戶對不同類型音頻信號感知失真的差異性,可更真實的反應用戶體驗。
為解決上述問題,本發明采用如下的技術方案:
一、音頻信號特性分類的無參考音頻質量評價方法,包括步驟:
步驟1,基于有參考音頻質量評價模型建立訓練模型,采用機器學習獲取不同類型音頻信號的音頻質量與網絡參數的關系,即無參考音頻質量評價模型,所述的網絡參數包括延遲時間和丟包率;
步驟2,在音頻信號網絡傳輸中,將當前丟包率、當前延遲時間和當前丟包數據的音頻信號類型輸入無參考音頻質量評價模型,獲得當前音頻質量。
步驟1進一步包括子步驟:
1.1將原始音經編碼、丟包、解碼后得到降質音頻,利用有參考音頻質量評價模型對降質音頻進行質量評價得到客觀質量得分MOS;
1.2將降質音頻延遲產生延遲損傷,在客觀質量得分MOS上減去延遲損傷Id,得到音頻質量MOSc;
1.3以音頻質量MOSc為目標,以延遲時間、丟包率、音頻信號類型為輸入,通過機器學習方式獲得不同類型音頻信號的音頻質量與網絡參數的關系,即無參考音頻質量評價模型。
步驟2進一步包括子步驟:
2.1采用不同編碼模式分別對不同類型音頻信號進行編碼獲得音頻編碼信息;
2.2對音頻編碼信息進行解碼,并統計當前丟包率和當前延遲時間,恢復丟包數據的編碼模式,獲取當前丟包數據的音頻信號類型;
2.3將當前丟包率、當前延遲時間和當前丟包數據的音頻信號類型輸入無參考音頻質量評價模型,獲得當前音頻質量MOSc。
上述音頻信號特性分類的無參考音頻質量評價方法還包括步驟:
根據當前音頻質量調整延遲時間和編碼碼率,使當前音頻質量取最大值。
二、一種音頻信號特性分類的無參考音頻質量評價系統,包括:
訓練模塊,基于有參考音頻質量評價模型建立訓練模型,采用機器學習獲取不同類型音頻信號的音頻質量與網絡參數的關系,即無參考音頻質量評價模型,所述的網絡參數包括延遲時間和丟包率;
質量評價模塊,用來在音頻信號網絡傳輸中,將當前丟包率、當前延遲時間和當前丟包數據的音頻信號類型輸入無參考音頻質量評價模型,獲得當前音頻質量。
上述訓練模塊進一步包括子模塊:
有參考音頻質量評分模塊,用來將原始音經編碼、丟包、解碼后得到降質音頻,利用有參考音頻質量評價模型對降質音頻進行質量評價得到客觀質量得分MOS;
音頻質量評分模塊,用來將降質音頻延遲產生延遲損傷,在客觀質量得分MOS上減去延遲損傷Id,得到音頻質量MOSc;
機器學習模塊,用來以音頻質量MOSc為目標,以延遲時間、丟包率、音頻信號類型為輸入,通過機器學習方式獲得不同類型音頻信號的音頻質量與網絡參數的關系,即無參考音頻質量評價模型。
上述質量評價模塊進一步包括子模塊:
編碼模塊,用來采用不同編碼模式分別對不同類型音頻信號進行編碼獲得音頻編碼信息;
網絡參數和音頻信號類型獲得模塊,用來對音頻編碼信息進行解碼,并統計當前丟包率和當前延遲時間,恢復丟包數據的編碼模式,獲取當前丟包數據的音頻信號類型;
質量評價模塊,用來將當前丟包率、當前延遲時間和當前丟包數據的音頻信號類型輸入無參考音頻質量評價模型,獲得當前音頻質量MOSc。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410196690.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種使熱封面溫度均勻的結構
- 下一篇:閥門的組裝件、汽車及其后橋制動系統





