[發(fā)明專利]用于確定音頻系統(tǒng)的感知質(zhì)量的方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201080046390.6 | 申請(qǐng)日: | 2010-08-09 |
| 公開(kāi)(公告)號(hào): | CN102549657A | 公開(kāi)(公告)日: | 2012-07-04 |
| 發(fā)明(設(shè)計(jì))人: | J.比倫德斯;J.范武格特 | 申請(qǐng)(專利權(quán))人: | 皇家KPN公司;荷蘭應(yīng)用自然科學(xué)研究組織 |
| 主分類號(hào): | G10L19/00 | 分類號(hào): | G10L19/00;H04M3/22 |
| 代理公司: | 中國(guó)專利代理(香港)有限公司 72001 | 代理人: | 劉春元;李家麟 |
| 地址: | 荷蘭*** | 國(guó)省代碼: | 荷蘭;NL |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 確定 音頻系統(tǒng) 感知 質(zhì)量 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于關(guān)于參考信號(hào)確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備(例如語(yǔ)音處理系統(tǒng))的輸出信號(hào)的感知質(zhì)量。本發(fā)明還涉及一種包括例如存儲(chǔ)于計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可執(zhí)行代碼的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)可執(zhí)行代碼適于在由處理器執(zhí)行時(shí)執(zhí)行這樣的方法。最后,本發(fā)明涉及一種用于關(guān)于音頻系統(tǒng)的用作參考信號(hào)的輸入信號(hào)確定質(zhì)量指標(biāo)的系統(tǒng),該質(zhì)量指標(biāo)代表音頻系統(tǒng)的輸出信號(hào)的感知質(zhì)量。
背景技術(shù)
可以主觀或者客觀地確定音頻設(shè)備的質(zhì)量。主觀測(cè)試耗費(fèi)時(shí)間、昂貴并且難以再現(xiàn)。因此已經(jīng)開(kāi)發(fā)若干方法以客觀方式測(cè)量音頻設(shè)備的輸出信號(hào)(特別是語(yǔ)音信號(hào))的質(zhì)量。在這樣的方法中,通過(guò)與參考信號(hào)比較來(lái)確定如從語(yǔ)音信號(hào)處理系統(tǒng)接收的輸出信號(hào)的語(yǔ)音質(zhì)量。
廣泛用于這一目的的當(dāng)前方法是在標(biāo)題為“Perceptual?evaluation?of?speech?quality?(PESQ):?An?objective?method?for?end-to-end?speech?quality?assessment?of?narrow-band?telephone?networks?and?speech?codecs”的ITU-T?Recommendation?P.862中描述的方法。在ITU-T?Recommendation?P.862中將確定來(lái)自語(yǔ)音信號(hào)處理系統(tǒng)的輸出信號(hào)(該信號(hào)一般失真)的質(zhì)量。輸出信號(hào)和參考信號(hào)(例如語(yǔ)音信號(hào)處理系統(tǒng)的輸入信號(hào))根據(jù)人類聽(tīng)覺(jué)系統(tǒng)的心理-生理(psycho-physical)感知模型映射到表示信號(hào)。基于這些信號(hào),確定差分信號(hào),該差分信號(hào)代表如與參考信號(hào)相比的輸出信號(hào)內(nèi)的失真。然后根據(jù)其中已經(jīng)對(duì)基于測(cè)試的人類聽(tīng)力感知的某些性質(zhì)建模的認(rèn)知模型處理差分信號(hào)以獲得質(zhì)量信號(hào),該質(zhì)量信號(hào)是輸出信號(hào)的聽(tīng)覺(jué)感知的質(zhì)量的測(cè)量。
一般而言,客觀測(cè)量系統(tǒng)(比如PESQ)在質(zhì)量減少方面解釋噪聲。然而這一解釋過(guò)于簡(jiǎn)單。在當(dāng)今電信系統(tǒng)(具體為使用IP語(yǔ)音(VOIP)和相似技術(shù)的系統(tǒng))中,噪聲對(duì)語(yǔ)音質(zhì)量的影響依賴于局部信號(hào)電平而變化。因而PESQ常常未提供在變得越來(lái)越流行的這樣的電信系統(tǒng)中處理的語(yǔ)音信號(hào)的最優(yōu)感知預(yù)測(cè)。
發(fā)明內(nèi)容
希望具有一種確定音頻系統(tǒng)的傳輸質(zhì)量的方法,該方法提供在如客觀測(cè)量確定的語(yǔ)音質(zhì)量與如在主觀測(cè)試中確定的語(yǔ)音質(zhì)量之間的改進(jìn)相關(guān)性。出于這一目的,本發(fā)明的實(shí)施例涉及一種用于關(guān)于參考信號(hào)確定質(zhì)量指標(biāo)的方法,該質(zhì)量指標(biāo)代表音頻設(shè)備(例如語(yǔ)音處理系統(tǒng))的輸出信號(hào)的感知質(zhì)量,其中處理和比較參考信號(hào)和輸出信號(hào),并且該處理包括將參考信號(hào)和輸出信號(hào)劃分成相互對(duì)應(yīng)時(shí)間幀,其中處理該還包括:將參考信號(hào)縮放成固定聲強(qiáng)級(jí);基于對(duì)縮放的參考信號(hào)執(zhí)行的測(cè)量來(lái)選擇輸出信號(hào)的時(shí)間幀;基于輸出信號(hào)的所選時(shí)間幀來(lái)計(jì)算噪聲對(duì)比度參數(shù),噪聲對(duì)比度參數(shù)是信號(hào)內(nèi)的噪聲對(duì)比度的測(cè)量;基于噪聲對(duì)比度參數(shù)在感知響度域中應(yīng)用參考信號(hào)和輸出信號(hào)中的至少一個(gè)的噪聲抑制;將參考信號(hào)和輸出信號(hào)感知相減以形成差值信號(hào)并且根據(jù)差值信號(hào)導(dǎo)出質(zhì)量指標(biāo)。質(zhì)量指標(biāo)提供音頻系統(tǒng)的傳輸質(zhì)量的客觀指示,該指示可以用來(lái)相互比較不同音頻系統(tǒng)。可以用根據(jù)PESQ已知的方式執(zhí)行質(zhì)量指示的導(dǎo)出。
噪聲對(duì)比度涉及優(yōu)選隨時(shí)間測(cè)量的噪聲電平的變化。將考慮噪聲電平的絕對(duì)值和噪聲的方差。噪聲電平隨時(shí)間的變化可以在確定噪聲對(duì)比度參數(shù)時(shí)發(fā)揮相關(guān)作用。圖6A-6F示出了作為時(shí)間函數(shù)的噪聲電平的示意圖以進(jìn)一步說(shuō)明噪聲對(duì)比度的概念。
圖6A示出了作為時(shí)間函數(shù)的噪聲電平的示例性圖,該圖示范噪聲對(duì)比度的概念。在這一例子中,平均噪聲電平例如在時(shí)間段T2期間一般駐留于某一基本電平周圍并且例如在時(shí)間段T1期間偶爾具有更高噪聲電平。圖6A中的信號(hào)的噪聲對(duì)比度涉及如在時(shí)間段T1期間存在的高噪聲電平與如在時(shí)間段T2期間存在的普通噪聲電平之間的差。噪聲對(duì)比度對(duì)音頻設(shè)備的輸出信號(hào)的感知質(zhì)量有影響。如果這樣的輸出信號(hào)將包括如圖6A中所示的噪聲模式,則超過(guò)正常噪聲電平的更高噪聲電平部分的存在可能如被收聽(tīng)者體驗(yàn)為高度干擾。具體而言,噪聲電平的改變使收聽(tīng)者集中于噪聲。可變?cè)肼曤娖揭虼艘话惚惑w驗(yàn)為比恒定噪聲電平更令人煩躁。
可以通過(guò)相互比較信號(hào)的不同部分來(lái)確定噪聲對(duì)比度。每個(gè)部分可以具有某一長(zhǎng)度。參考圖6B、6C中所示圖示范對(duì)在噪聲對(duì)比度評(píng)價(jià)中使用的信號(hào)部分時(shí)間區(qū)間長(zhǎng)度的影響。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于皇家KPN公司;荷蘭應(yīng)用自然科學(xué)研究組織,未經(jīng)皇家KPN公司;荷蘭應(yīng)用自然科學(xué)研究組織許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080046390.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 車輛媒體系統(tǒng)
- 用于自適應(yīng)話音可懂度處理的系統(tǒng)
- 去除音頻系統(tǒng)關(guān)機(jī)雜音的電路
- 一種處理音頻系統(tǒng)嘯叫的方法及音頻系統(tǒng)
- 一種車載娛樂(lè)系統(tǒng)中音頻切換管理系統(tǒng)及其控制方法
- 調(diào)整揚(yáng)聲器設(shè)置
- 音頻系統(tǒng)遠(yuǎn)程診斷系統(tǒng)及轉(zhuǎn)換器
- 基于監(jiān)視到的針對(duì)音頻內(nèi)容的響應(yīng)定制頭部相關(guān)傳遞函數(shù)
- 音頻系統(tǒng)控制方法、裝置、終端和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 用于個(gè)性化聲傳遞函數(shù)的動(dòng)態(tài)確定的音頻系統(tǒng)
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無(wú)線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點(diǎn)和感知節(jié)點(diǎn)
- 感知無(wú)線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點(diǎn)和匯聚中心
- 感知無(wú)線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點(diǎn)
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫(kù)
- 基于認(rèn)知數(shù)據(jù)庫(kù)和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動(dòng)駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





