[發明專利]待測試語音的處理方法、裝置及系統有效

申請號：	201410060241.5	申請日：	2014-02-21
公開（公告）號：	CN103810996A	公開（公告）日：	2014-05-21
發明（設計）人：	董明;劉志;吳延年;丁玉國	申請（專利權）人：	北京凌聲芯語音科技有限公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L25/51
代理公司：	北京康信知識產權代理有限責任公司 11240	代理人：	吳貴明;張永明
地址：	100083 北京市海***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	測試語音處理方法裝置系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及語音處理領域，具體而言，涉及一種待測試語音的處理方法、裝置及系統。

背景技術

在口語自動評測系統中，被測試者往往被要求發出受限定的發音，例如朗讀制定的文本，或是復述聽到的語音等。而口語自動評測系統會對被測試者（即說話人）發出的聲音錄音后進行評測，然后給出發音質量的反饋，例如句子得分、單詞得分等。在實際應用中說話人的發音可能同目標發音不一致，這種不一致存在兩種情況：一是說話人發音不標準或是發音錯誤，這種現象在非母語說話人中非常常見，例如說話人受母語影響，導致某些音素發音不夠標準，或是不知道字母對應音素的正確發音導致音素發音錯誤等等，對于這種情況，系統應當根據錯誤情況給出反饋，如發音不標準時音素和單詞得分比正確讀時的得分低，并且系統可以指出讀錯的音素等；另一種情況是是無關語音，即實際錄音同目標發音無關，例如系統錄音時說話人根本沒說話，錄音中只有環境噪聲，或是錄音時說話人胡亂說一些和目標發音不相關的語音，這種情況與第一種情況不同，它無規律可循。由上述可知，口語自動評測系統給出很低的分數可能由于環境影響錄入噪聲，也可能由于說話人口語水平太差。當然在使用口語自動評測系統時即使一個口語發音很好的人也可能故意亂說來測試系統性能。當用戶在測試系統的魯棒性和評分準確性時，往往會用各種聲音（如無關語音和有關語音）作為輸入，來看系統輸出是否合理，對于系統噪音或者有人故意干擾的無關語音，錄音系統應當直接拒識。

對無關語音拒識的途徑主要有兩種：一是通過對說話人語音的識別來判斷某段發音是否是目標發音，具體地，利用垃圾模型或背景模型來識別出錄入的聲音是否為非目標發音，這種方法主要用于識別系統中集外詞檢測及發音評測系統中的發音錯誤檢測，但是對于環境噪音無法準確拒識，得到的評測結果不準確；另一種是識別結果的后處理方法，在得到識別結果后利用置信度來鑒別識別結果是否正確，對于置信度低于一定閾值的語音予以拒識，使用這種方法只是對結果進行過濾，無法對錄入的語音進行準確的拒識，有可能會將相關語音的結果拒識掉，而保留了無關語音的識別結果，從而得到的結果也不準確。

上述的口語自動評測系統是指對口語的發音、節奏和語調提供客觀統一標準的評估系統；上述的無關語音即為不屬于語音評測系統的評測對象的聲音。

針對現有技術中口語自動評測系統無法對無關語音準確拒識導致評測結果不準確的問題，目前尚未提出有效的解決方案。

發明內容

針對相關技術中口語自動評測系統無法對無關語音準確拒識導致評測結果不準確的問題，目前尚未提出有效的解決方案，為此，本發明的主要目的在于提供一種待測試語音的處理方法、裝置及系統，以解決上述問題。

為了實現上述目的，根據本發明的一個方面，提供了一種待測試語音的處理方法，該處理方法包括：對待測試語音進行語音識別，得到識別結果；依據識別結果中的聲學概率數據和音素切分信息計算置信度；對待測試語音和識別結果進行特征分析，得到特征數據；使用特征數據和置信度構建用于拒識的特征向量；對特征向量進行拒識判決，確定待測試語音是否為拒識語音。

進一步地，對特征向量進行拒識判決，確定待測試語音是否為拒識語音包括：計算特征向量的接受概率和拒絕概率；在拒絕概率與接受概率的對數域差值大于預設閾值時，確定待測試語音為拒識語音；在對數域差值小于或等于預設閾值時確定待測試語音不為拒識語音。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京凌聲芯語音科技有限公司，未經北京凌聲芯語音科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410060241.5/2.html，轉載請聲明來源鉆瓜專利網。