[發明專利]一種嘈雜環境下特定目標語音端點搜索的方法在審

申請號：	201710670308.0	申請日：	2017-08-08
公開（公告）號：	CN107424628A	公開（公告）日：	2017-12-01
發明（設計）人：	王賀;楊兆鵬;李莉	申請（專利權）人：	哈爾濱理工大學
主分類號：	G10L25/78	分類號：	G10L25/78;G10L25/87;G10L25/84;G10L25/21
代理公司：	哈爾濱市偉晨專利代理事務所(普通合伙)23209	代理人：	張偉
地址：	150080 黑龍***	國省代碼：	黑龍江;23
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種嘈雜環境特定目標語音端點搜索方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域：

本發明涉及語音處理領域，尤其涉及一種嘈雜環境下特定目標語音端點搜索的方法。

背景技術：

隨著語音識別技術的出現和日漸成熟,通過預先錄入特定目標的聲音樣本,提取目標人物一無二的語音特征并保存在數據庫中,應用時將待驗證的聲音與數據庫中的特征進行匹配,從而決定所尋目標的身份。但是在嘈雜環境下和安靜環境下的差異，經常無法判斷準確，不能正確的截取有用的語音信息，甚至遠遠低于各種語音識別應用的最低限度，導致無法使用。

發明內容：

本發明為克服上述缺陷，提供了一種嘈雜環境下特定目標語音端點搜索的方法，其通過以語音片的方式對聲音進行錄制，對初始的若干時間片進行采樣和能量計算，根據能量的計算結果判斷語音的起點和終點，使之適應嘈雜環境和安靜環境下的不同參數檢測標準，從而自適應環境檢測語音的端點。

本發明采用的技術方案在于：一種嘈雜環境下特定目標語音端點搜索的方法，包括：

步驟1：錄制多個連續的語音片獲取多個分幀段作為樣本語音；

步驟2：根據各分幀段的能量值計算樣本語音中每個語音片的語音平均能量值和所有語音片的平均能量值；

步驟3：從所述各分幀段中獲取其能量值超過語音平均能量值和平均能量值的分幀段，則以該分幀段為句中間幀對該幀的前序幀或后序幀進行掃描，若前序幀或后序幀的能量閥值小于設定語音平均能量值，則將該幀與所述句中間幀按幀起始順序合并成為獨立句；

步驟4：判斷所述獨立句的幀長是否為設定的短句幀長范圍，若是，則將歷史存儲的短獨立句標本與當前獨立句進行對比，若匹配度低于設定值，則將獨立句標識為噪音句；

步驟5：將所述音頻的各分幀段獲得的未標識為噪音句的獨立句作為音頻的斷句。

進一步優選地，所述步驟3還包括：若所述獨立句的幀長超出設定獨立幀長，則計算該獨立局每幀的譜熵比，以最低譜熵比所對應的幀作為分割點，將上述獨立局風格為兩個獨立句。

本發明的有益效果是：通過以語音片的方式對聲音進行錄制，對初始的若干時間片進行采樣和能量計算，根據能量的計算結果判斷語音的起點和終點，使之適應嘈雜環境和安靜環境下的不同參數檢測標準，從而自適應環境檢測語音的端點。

具體實施方式：

下面將結合本發明，對本發明的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基于本發明中的實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例，都屬于本發明保護的范圍。

本發明的一種嘈雜環境下特定目標語音端點搜索的方法，包括：

步驟1：錄制多個連續的語音片獲取多個分幀段作為樣本語音。

本發明可以安裝在服務器上，也可以安裝在個人計算機或移動計算設備上。所稱的計算終端即可以是服務器，也可以是個人計算機，也可以是移動計算設備。首先，向服務器上傳音視頻文件，或者在個人計算機或者移動計算設備上打開音視頻文件。之后，計算設備提取音視頻文件里的音頻流，將音頻流統一到固定采樣頻率有符號單通道數據。之后采用預先設定的分幀參數，對數據進行分幀處理。

步驟2：根據各分幀段的能量值計算樣本語音中每個語音片的語音平均能量值和所有語音片的平均能量值。

語音端點的檢測基于語音的能量值實現，首先要計算單個語音片的語音平均能量值和所有語音片的平均能量值(每個語音片的語音平均能量值求和后除以語音片的個數)。

步驟3：從所述各分幀段中獲取其能量值超過語音平均能量值和平均能量值的分幀段，則以該分幀段為句中間幀對該幀的前序幀或后序幀進行掃描，若前序幀或后序幀的能量閥值小于設定語音平均能量值，則將該幀與所述句中間幀按幀起始順序合并成為獨立句；若所述獨立句的幀長超出設定獨立幀長，則計算該獨立局每幀的譜熵比，以最低譜熵比所對應的幀作為分割點，將上述獨立局風格為兩個獨立句。

步驟4：判斷所述獨立句的幀長是否為設定的短句幀長范圍，若是，則將歷史存儲的短獨立句標本與當前獨立句進行對比，若匹配度低于設定值，則將獨立句標識為噪音句。

步驟5：將所述音頻的各分幀段獲得的未標識為噪音句的獨立句作為音頻的斷句。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學，未經哈爾濱理工大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710670308.0/2.html，轉載請聲明來源鉆瓜專利網。