[發明專利]用于估計語音質量的方法和設備有效
| 申請號: | 200580051845.2 | 申請日: | 2005-10-17 |
| 公開(公告)號: | CN101292459A | 公開(公告)日: | 2008-10-22 |
| 發明(設計)人: | M·韋薩南;P·瓊納;J·法格斯特倫 | 申請(專利權)人: | 艾利森電話股份有限公司 |
| 主分類號: | H04L1/20 | 分類號: | H04L1/20;G10L19/00 |
| 代理公司: | 中國專利代理(香港)有限公司 | 代理人: | 張亞寧;張志醒 |
| 地址: | 瑞典斯*** | 國省代碼: | 瑞典;SE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 估計 語音 質量 方法 設備 | ||
技術領域
本發明涉及用于估計通信網絡中語音質量的方法和設備,并特別可應用于(雖然不是必須的)估計全球移動通信網絡中的語音質量。
背景技術
在傳送語音信息的幾乎所有通信網絡中存在一種可能性,即語音質量將由于干擾或損壞而降低質量。在數字網絡的情況下,發送質量通常高于利用模擬網絡的質量,雖然網絡運營者一直在努力改善。
在全球移動通信網絡(UMTS)蜂窩系統的情況下,對語音數據進行壓縮以節約帶寬并在多個不同幀結構中進行終端對終端的傳輸。可獲得的最大發射質量受到所使用的語音壓縮算法的限制。不過,由于在發射路徑的無線支路(radio?leg)上傳輸幀,所以對幀的損壞將導致某些進一步的質量降低。還可能發生整體幀的丟失。如果損壞程度和幀丟失較為顯著,則終端用戶將感覺到接收到的信號語音質量降低。
傳統上,電話網絡運營者通過引導樣本呼叫并詢問參與者他們對于呼叫質量的主觀觀點。國際電信聯盟通信標準化部門(ITU-T)在其推薦標準P.800中提供了用于執行聽音測試的指南。推薦標準指定了應該執行聽音測試的環境和設置。通過遵循這些指南可以從不同的測試條件獲得比較結果。在這些測試中,未經訓練的聽者通過評價等級評價經受測試系統的質量。通常,使用絕對種類定級(ACR)。ACR需要聽者通過將語音質量按一至五的等級進行分級來估計系統的質量。(包括全部聽者的)ACR等級的平均值被稱為平均意見得分(MOS)。
雖然主觀測試必然是最準確的語音質量估計方法,但是它有它的限制。執行聽音測試是耗時和昂貴的過程,并且對于在運營的網絡上廣泛使用是不切實際的。因此,通信行業已經嘗試開發客觀和自動的語音質量估計方法。
語音質量感知評價(PESQ)是通過推薦標準P.862中的ITU-T標準化的侵入式語音質量估計算法。PESQ算法可以用于預測多種測試條件和應用中的窄帶電話和編碼器/解碼器(codecs)的主觀質量。PESQ算法將其輸入樣本采用成線性16-比特PCM格式,以8或16KHz采樣頻率進行采樣。理想的采樣長度在8到20秒之間。該算法使用心理聲學感知模型來計算參考語音樣本與質量降低樣本之差。樣本之差被映射成從-0.5到4.5范圍的PESQ分數。由于MOS標度的范圍是從1到5,所以ITU-T已經定義了允許對PESQ分數與主觀MOS分數進行比較的映射函數。考慮到發射信道誤差、代碼轉換、分組丟失和分組丟失隱藏方法的影響,PESQ算法已經表現出在估計語音質量方面可接受的準確性。已經將PESQ分數和主觀聽音測試結果之間的相關性定標(benchmark)為大約0.935。不過在例如利用PCM類型codecs估計分組丟失的某些情況下,相關性被減小。因此,不能用PESQ完全代替主觀測試。
P.563算法是通過推薦標準P.563中的ITU-T標準化的非侵入式語音質量估計方法。不同于PESQ算法,P.563算法不需要參考樣本來估計語音質量。因此該算法可以應用于呼叫鏈路中任何地方的現場網絡(live?network)中。
在最近開發的互聯網語音傳輸協議(VoIP)的情況下,已經出現客觀和自動的語音質量估計方法,例如來自Telchemy?Inc.的VQMonTM和來自Psytechnics?Ltd.的PsyVoIPTM。這些方法嘗試估計IP-網絡故障(延遲、抖動、分組丟失)怎樣影響網VoIP呼叫的語音質量。通過檢查用于傳送VoIP中的語音的實時協議RTP幀,對故障進行分析。由于分析是對真實業務進行的,所以可以經常執行而單獨的測試呼叫是不必要的。
發明內容
根據本發明的第一方面,提供一種與包括核心網絡和接入網絡的通信系統中的話音呼叫有關的語音信息質量的估計方法,其中語音信息在接入網絡和核心網絡之間以及在接入網絡中以幀的形式被傳送,該方法包括:
為接入網絡和核心網絡之間和/或在核心網絡中傳輸的幀確定幀丟失的比率;以及
使用通過模擬有代表性的語音樣本的幀丟失而采集到的數據將幀丟失的比率映射到質量估計值,并確定損壞的語音樣本的質量估計值。
在本發明的一個實施例中,該方法包括通過對丟失幀的數目和損壞幀的數目進行記數而確定所述幀丟失的比率。
在本發明的實施例中,僅考慮包含語音的幀,而忽略無聲的幀。因此,所述比率是相對于語音幀總數的丟失的(和損壞的)語音幀的數目。
優選地,將該方法應用于例如為期5秒的語音片段。還可以將該方法應用于連續的語音片段,以提供連續更新的語音質量估計。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于艾利森電話股份有限公司,未經艾利森電話股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580051845.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:制備太陽能級多晶硅的新工藝
- 下一篇:一種依諾沙星凍干粉針組方及其制備工藝





