[發明專利]語音輸入設備使用異常的檢測方法及系統有效
| 申請號: | 201110265473.0 | 申請日: | 2011-09-08 |
| 公開(公告)號: | CN102324229A | 公開(公告)日: | 2012-01-18 |
| 發明(設計)人: | 徐波;黃申;王士進;李宏言;陳振標;柯登峰;高鵬;李鵬 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G10L11/00 | 分類號: | G10L11/00;G10L19/00 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 周國城 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 輸入 設備 使用 異常 檢測 方法 系統 | ||
技術領域
本發明涉及電子信息行業語音信號處理技術領域,尤其涉及一種語音輸入設備使用異常的檢測方法及系統。
背景技術
語音作為信息傳遞的重要載體,與其相關構成的通信、編碼、存儲和處理等系統已經成為現代社會信息交流的必要手段,且已廣泛應用于社會各個領域。尤其是在計算機自動口語考試中,對于前端輸入語音質量好壞與否的判斷成為后端學習者口語水平估計的關鍵。而前端輸入語音質量通常和口語學習者的水平是無關的。這就需要在系統設計時,盡可能地使其保持相同的標準和質量,以便學習者能夠公平、公正地進行考試。為達到這個目的,一方面要選用專用的統一制式考試用耳麥,并對耳麥故障進行自動排查、預警提出一系列行之有效的規則和措施;另一方面則需要通過自動檢測的方法,確定測試者由于使用不當等主觀原因而導致的前端語音輸入異常情況,由系統自動給出錯誤預警。本發明更關注由于主觀人為使用原因導致的異常情況,通常稱之為“使用設備異?!薄Ec之對應的則為硬件故障原因導致的異常情況,通常稱之為“純設備異?!?,該部分異常的檢測與處理不在本文所述之列。
多項口語自動評分的研究表明:即使評分算法性能再為優異、對噪聲再為魯棒,如果通過麥克風得到的前端語音輸入信號質量不好,對自動評分系統的結果就會帶來很大的偏頗。而在如今的技術條件下,由于麥克風質量缺陷導致的前端語音信號質量缺陷,其概率往往是比較低的。經過大規模觀察可以發現,多數前端語音信號質量缺陷的原因是由于使用者人為原因造成的。主要包括以下幾種類型:
1)遠講:導致該現象的原因,一方面為使用者唇部距離麥克風過遠,另一方面為麥克風位置放置錯誤,包括遠離話者、戴偏或者戴反;
2)信噪比過低:口語自動測試時,由于教室房間的物理材質、形狀,麥克風之間距離違反要求等原因導致周圍發聲者的語音湮沒了目標語音,造成輸入信噪比過低;
而現有的語音增強算法通常不能滿足以上需求。語音增強的過程勢必會在去除噪聲的情況下對主體語音有所影響。這也就更加彰顯了計算機自動檢測使用設備異常情況的重要性。通過自動檢測這些錯誤,更換耳麥或安排、指導測試者正確使用設備,重新進行考試,是目前在計算機口語評測中比較合理的方案。但是其召回率和檢測精度仍是亟待解決的問題。
在聽感上,使用設備異常語音和語音質量評估是休戚相關的。語音質量評估是以人為主體來評價語音質量的,異常語音必然會對語音質量在聽感上有所影響。該方式雖較為繁雜,但由于人是語音最終的接受者,因此,這種評價應是語音質量的真實反映。目前,國內外使用較多的主觀評價方法有:平均意見分MOS、音韻字可懂度測量DRT和滿意度測量DAM等。其中,MOS評分法是一種廣為使用的主觀評價方法,它以平均意見分來衡量語音質量,用五個等級來表示語音的質量等級:優(5分)、良(4分)、一般(3分)、差(2分)、壞(1分)。顯然,主觀評價的優點是符合人對語音質量的感覺,缺點是費時費力費錢,且靈活性不夠、重復性和穩定性較差,受人的主觀影響較大等。為了克服主觀評價的缺點,人們不得不尋求一種能夠以方便、快捷的方式給出語音質量評估的客觀評估方法,即用機器來自動判別語音的質量。不過,值得注意的是,研究語音質量客觀評價的目的不是要用客觀評價來完全替代主觀評價,而是使客觀評價成為一種既方便快捷又能夠準確預測出主觀評價值的手段,并將該手段應用在異常語音檢測上。
盡管客觀評價具有省時省力等優點,但它還不能夠反映機器對使用設備異常語音的接受能力。有兩個瓶頸制約著評估模塊的發揮:首先,語音質量評估對于使用設備異常語音(尤其是遠講語音)和背景聲語音的區分度不夠(MOS值均較低),故系統應具有對使用設備異常語音、背景聲語音以及正常語音有較強的區分能力。而在信號特征的表現上,使用設備異常語音通常是與正常語音、背景聲語音有明顯區別的,所以加入特征提取和分類器的音頻分類模塊,在語音質量評估模塊的前端進行粗篩,可以有效提高系統精度;其次,傳統的介入式語音質量評估需要依賴純凈情況下的參考語音,如何針對使用設備異常語音的特點進行非介入式的語音質量評估,也是本發明所關注的問題。
發明內容
(一)要解決的技術問題
為解決上述的一個或多個問題,本發明提供了一種語音輸入設備使用異常的檢測方法及系統,以提前發現遠講、背景干擾過強等使用過程中麥克風設備的異常問題。
(二)技術方案
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110265473.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:剎車預警裝置及方法
- 下一篇:車燈工作狀況監測電路





