[發(fā)明專利]用于測量語音可懂度的方法和測試信號有效
| 申請?zhí)枺?/td> | 200580051611.8 | 申請日: | 2005-09-20 |
| 公開(公告)號: | CN101268624A | 公開(公告)日: | 2008-09-17 |
| 發(fā)明(設(shè)計)人: | J·程 | 申請(專利權(quán))人: | 艾利森電話股份有限公司 |
| 主分類號: | H04B3/23 | 分類號: | H04B3/23;H04B17/00;G10L21/02 |
| 代理公司: | 中國專利代理(香港)有限公司 | 代理人: | 曾祥夌;王忠忠 |
| 地址: | 瑞典斯*** | 國省代碼: | 瑞典;SE |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 測量 語音 可懂度 方法 測試 信號 | ||
技術(shù)領(lǐng)域
本發(fā)明一般涉及移動通信網(wǎng)絡(luò)中語音可懂度的客觀測量,更具體來說,涉及用于測量和/或改進這類網(wǎng)絡(luò)中語音可懂度的新穎方法。
背景技術(shù)
語音的可懂度簡稱作語音可懂度,一般涉及語音理解的程度,并且是語音通信有效性的度量。講話很快或者講話含糊不清的人可能很難被理解。但是,如果消息不是完全聽得到的,和/或如果消息在送往聽者途中已經(jīng)失真,則即使用聽者的母語流利說出的消息也可能被聽者誤解。另一方面,例如,合成的話音可能是聽者充分理解的,但被認為是刺耳、異常并且一般是低質(zhì)量的,意味著質(zhì)量欠缺的消息仍然可能是可懂的。因此,語音可懂度一般不限于語音質(zhì)量,而是往往看作是對于語音理解的有效性的更一般的度量。
存在用于根據(jù)大量人類說話者和聽者所執(zhí)行的聽力測試來主觀地測量語音可懂度的標準化方法。在稱作“Methodes?for?subjectivedetermination?of?transmission?quality”的ITU-T標準P.800中,提出了范圍從0至5的所謂平均意見評分(MOS)方法,通過聽力測試來評估電信系統(tǒng)的語音質(zhì)量。但是,這種類型測試要求具有大量仔細選擇的講話者和聽者組,使得測量費用極高且費時。
另外,將語音質(zhì)量結(jié)果實時反饋到所考慮的系統(tǒng)顯然是不可能的。
因此,在定義用于客觀測量語音可懂度的方法、由此消除費時和主觀評估方面存在普遍興趣。
在ITU-T?G.168“Digital?network?echo?canceller”中,附圖I.6-15/G.168演示了主觀語音質(zhì)量與客觀測量之間的某些關(guān)系,這些關(guān)系有助于說明通過客觀方法來測量語音質(zhì)量/語音可懂度的可能性。
IEC?60268-16“Objective?rating?of?speech?intelligibility?by?speechtransmission?index”在音響系統(tǒng)設(shè)備中是標準化工作,它涉及用于相對于可懂度來確定語音傳輸質(zhì)量的客觀方法。這些方法可用于比較各個位置上以及相同收聽空間的各種條件下的語音傳輸質(zhì)量,以便評估語音通信信道,具體來說評估聲音屬性的變化影響、例如來自回聲、回響和噪聲的影響。
IEC?60268-16中提出的語音可懂度測量系統(tǒng)的一種實際配置通常包括聲源/喇叭和麥克風(fēng)。所謂語音傳輸指數(shù)(STI)根據(jù)在例如劇院或音樂廳之類的房間中或者通過通信信道發(fā)出聲音時的一組測試信號的調(diào)制的降低來測量。對于諸如劇院之類的房間中的測量,每個測試信號通常將由聲源向接收所發(fā)送聲音的麥克風(fēng)系統(tǒng)發(fā)送。更準確地說,語音傳輸指數(shù)(STI)是基于語音頻率范圍中多個倍頻帶的加權(quán)份額的客觀測量。每個倍頻帶信號由一組不同的調(diào)制頻率來調(diào)制,以便定義不同倍頻帶中不同調(diào)制的測試信號的全矩陣。定義調(diào)制的降低的所謂調(diào)制傳遞函數(shù)對于每個倍頻帶中的各調(diào)制頻率單獨確定,最后將所有調(diào)制頻率和所有倍頻帶的調(diào)制傳遞函數(shù)值組合形成語音可懂度的總度量。
電信系統(tǒng)的語音傳輸指數(shù)STITEL是STI的簡化形式,并且在單個電信信道的典型條件下可用來代替STI。
雖然STI方法的引入代表了對于語音可懂度客觀測量的顯著進步,但是,這些方法由于需要大量的測試信號而仍然相當(dāng)費時,并且它們還專用于比較簡單的設(shè)定、諸如受限制的收聽空間或孤立的通信信道的測量。
在現(xiàn)代移動通信網(wǎng)絡(luò)中,通常存在更復(fù)雜的技術(shù)設(shè)定,包括具有回聲、回響和噪聲影響的相關(guān)信號通道。例如,在公共陸地移動網(wǎng)絡(luò)(PLMN)的數(shù)字核心網(wǎng)絡(luò)中,一般存在所謂的話音增強裝置,例如用于改進語音質(zhì)量和語音可懂度的回聲消除器(EC)、噪聲降低(NR)、移動串?dāng)_控制(MCC)和電平控制(LC)裝置。在網(wǎng)絡(luò)側(cè),回聲消除器(EC)是負責(zé)處理作為干擾回聲反射到近端信號通道中的部分遠端信號的特別重要的話音增強裝置。在這類更復(fù)雜的技術(shù)設(shè)定中,需要用于客觀測量語音可懂度的有效方法。測量結(jié)果則可用作優(yōu)化和協(xié)調(diào)諸如數(shù)字移動核心網(wǎng)絡(luò)之類的網(wǎng)絡(luò)中的話音增強裝置的操作的基礎(chǔ)。
國際專利公布WO?2004/002127A1涉及具有專用不固定回聲消除屬性的回聲消除器。提出了不固定回聲消除器,以便防止回聲估計中、特別是殘余回聲中的固定分量不斷地使近端語音失真。這在語音質(zhì)量和語音可懂度方面改進了回聲消除器性能,這在與雙方通話相反的單方通話近端語音的情況中特別重要。
美國專利5,636,272涉及用于提高喇叭輸出的可懂度以及用于電話中回聲消除的方法和裝置。電話包括用于處理語音輸入信號以便產(chǎn)生可懂度增強信號的可懂度增強器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于艾利森電話股份有限公司,未經(jīng)艾利森電話股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580051611.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





