[發明專利]一種適用于混響環境的漢語語音清晰度評測算法在審
| 申請號: | 201611014116.6 | 申請日: | 2016-11-17 |
| 公開(公告)號: | CN106782611A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 章斯宇;孟子厚 | 申請(專利權)人: | 中國傳媒大學 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L25/90;G10L25/93 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙)11435 | 代理人: | 陳姍姍 |
| 地址: | 100024 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 適用于 混響 環境 漢語 語音 清晰度 評測 算法 | ||
技術領域
本發明屬于聲頻測量領域,特別涉及一種適用于混響環境的漢語語音清晰度客觀評測算法。
背景技術
語音清晰度是衡量語音傳輸系統性能優劣的重要評價指標,清晰度評測在通信、擴聲、音質設計等領域廣泛應用,一般用正確接收的語言單位(比如單音節)與全部發送語言單位的比值度量清晰度。清晰度的評測方法分為主觀評測和客觀評測兩類,主觀評測方法是組織人員進行現場清晰度測試打分,盡管主觀評測結果直接準確,但實際操作困難,因此工程中更多采用客觀評測方法。清晰度客觀評測是用某個客觀量評價系統的清晰度,這個客觀量是根據一定的計算模型計算得到的,并且是與主觀評測結果高度相關的。聲頻技術領域使用的語音清晰度客觀評測指標主要有:清晰度指數AI(Articulation Index),輔音損失率%Alcon(Articulation loss of consonant),語言傳輸指數STI(Speech Transmission Index)等,這些客觀評測方法均有其各自的計算模型,采用不同的信號處理方法,適用于不同的條件和場合。然而,將這些評測方法直接應用到漢語聲傳播環境的清晰度評測時會出現失效的問題,即客觀評測結果與漢語語音清晰度主觀測試結果不匹配,客觀評測結果較差對應的漢語實際聽聞感受可能尚可,而客觀評測結果較好對應的漢語實際聽感可能不佳。
分析現有技術評測漢語語音清晰度失效原因可知清晰度客觀評測算法的可靠性與評測對象自身的特性有關,現有的清晰度客觀評測方法是根據荷蘭語或英語等印歐語系語言特性提出的,并沒有考慮漢語的語音學和語言學特性。漢語屬于漢藏語系,是一種聲調語言,聲調起到辨義作用,漢語以單音節為主,一個漢字就是一個單音節,每個音節包含聲母、韻母和聲調三個部分,有別于傳統輔-元-輔的音節構造,由于存在較多的同音字,漢語的單字可以視作無語義,這些語音特點都與外語存在顯著區別,因此在語音傳輸過程中各干擾要素對漢語語音清晰度的影響結果與外語會有所不同。此外,傳統的清晰度客觀評測算法是將語音傳輸系統視作一個整體,饋給系統一個標準測試信號,根據系統的輸出信號相對輸入信號的變化衰減程度,進而給出一個具體的客觀量值,計算過程中不涉及傳輸系統中干擾因素的聲學屬性,因此不能反映傳輸系統的聲學特性是如何導致語音清晰度的下降,評測結果難以對清晰度降低的原因起到“診斷”和“治療”作用,無法指導聲傳輸系統的功能設計。語音傳輸過程中影響清晰度的聲學因素有很多,其中混響是一類主要的干擾條件,如果房間吸聲或反射面處理不當,混響作用下語音信號的直達聲和混響聲混疊導致接收端清晰度下降。目前并沒有專門針對混響環境的并且考慮了漢語語音學和與語言學特性的清晰度評測方法。
發明內容
本發明給出了一種適用于純混響環境的漢語聽感清晰度客觀評測方法,建立了以混響時間為自變量的漢語單音節、聲母、韻母和聲調清晰度的客觀評測模型。只需要測量傳輸系統的混響時間就可以直接計算出相應的漢語語音清晰度值,該方法針對漢語的語音學和聽感特性,適用于漢語傳播為主的聲傳輸系統,同時計算結果還可以對傳輸系統的混響條件設置起到一定的指導作用。
提出了一種適用于混響環境的漢語語音清晰度客觀評測算法,包括測量能夠表征影響漢語語音清晰度的混響條件下的客觀聲學參數的步驟,其特征在于,根據所建立的客觀聲學參數與漢語的主觀聽感清晰度間的對應函數關系,得到當前傳輸帶寬有限條件下的漢語語音清晰度,其中,客觀聲學參數為自變量;其中,混響時間T對應混響條件下的客觀聲學參數。
給出了在混響條件下的漢語單音節清晰度QF與混響時間T之間的函數關系
進一步給出了在混響條件下的漢語聲母清晰度QFsm、韻母清晰度QFsm及聲調清晰度QFsd與混響時間T之間的函數。
附圖說明
圖1為混響條件下漢語語音清晰度主觀聽感實驗示意圖
圖2為漢語單音節、聲母、韻母和聲調清晰度與混響時間的關系圖
圖3為混響環境中漢語語音清晰度實測值與預測值的誤差表示圖
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國傳媒大學,未經中國傳媒大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611014116.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻會議的音質測試方法
- 下一篇:一種逆向爆音檢測方法及其裝置





