[發明專利]一種嘈雜環境下特定目標語音端點搜索的方法在審
| 申請號: | 201710670308.0 | 申請日: | 2017-08-08 |
| 公開(公告)號: | CN107424628A | 公開(公告)日: | 2017-12-01 |
| 發明(設計)人: | 王賀;楊兆鵬;李莉 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L25/87;G10L25/84;G10L25/21 |
| 代理公司: | 哈爾濱市偉晨專利代理事務所(普通合伙)23209 | 代理人: | 張偉 |
| 地址: | 150080 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 嘈雜 環境 特定 目標 語音 端點 搜索 方法 | ||
技術領域:
本發明涉及語音處理領域,尤其涉及一種嘈雜環境下特定目標語音端點搜索的方法。
背景技術:
隨著語音識別技術的出現和日漸成熟,通過預先錄入特定目標的聲音樣本,提取目 標人物一無二的語音特征并保存在數據庫中,應用時將待驗證的聲音與數據庫中的特征進 行匹配,從而決定所尋目標的身份。但是在嘈雜環境下和安靜環境下的差異,經常無法判 斷準確,不能正確的截取有用的語音信息,甚至遠遠低于各種語音識別應用的最低限度, 導致無法使用。
發明內容:
本發明為克服上述缺陷,提供了一種嘈雜環境下特定目標語音端點搜索的方法,其通 過以語音片的方式對聲音進行錄制,對初始的若干時間片進行采樣和能量計算,根據能量 的計算結果判斷語音的起點和終點,使之適應嘈雜環境和安靜環境下的不同參數檢測標 準,從而自適應環境檢測語音的端點。
本發明采用的技術方案在于:一種嘈雜環境下特定目標語音端點搜索的方法,包括:
步驟1:錄制多個連續的語音片獲取多個分幀段作為樣本語音;
步驟2:根據各分幀段的能量值計算樣本語音中每個語音片的語音平均能量值和所有 語音片的平均能量值;
步驟3:從所述各分幀段中獲取其能量值超過語音平均能量值和平均能量值的分幀 段,則以該分幀段為句中間幀對該幀的前序幀或后序幀進行掃描,若前序幀或后序幀的能 量閥值小于設定語音平均能量值,則將該幀與所述句中間幀按幀起始順序合并成為獨立 句;
步驟4:判斷所述獨立句的幀長是否為設定的短句幀長范圍,若是,則將歷史存儲的 短獨立句標本與當前獨立句進行對比,若匹配度低于設定值,則將獨立句標識為噪音句;
步驟5:將所述音頻的各分幀段獲得的未標識為噪音句的獨立句作為音頻的斷句。
進一步優選地,所述步驟3還包括:若所述獨立句的幀長超出設定獨立幀長,則計算 該獨立局每幀的譜熵比,以最低譜熵比所對應的幀作為分割點,將上述獨立局風格為兩個 獨立句。
本發明的有益效果是:通過以語音片的方式對聲音進行錄制,對初始的若干時間片進 行采樣和能量計算,根據能量的計算結果判斷語音的起點和終點,使之適應嘈雜環境和安 靜環境下的不同參數檢測標準,從而自適應環境檢測語音的端點。
具體實施方式:
下面將結合本發明,對本發明的技術方案進行清楚、完整地描述,顯然,所描述的實 施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域 普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護 的范圍。
本發明的一種嘈雜環境下特定目標語音端點搜索的方法,包括:
步驟1:錄制多個連續的語音片獲取多個分幀段作為樣本語音。
本發明可以安裝在服務器上,也可以安裝在個人計算機或移動計算設備上。所稱的計 算終端即可以是服務器,也可以是個人計算機,也可以是移動計算設備。首先,向服務器 上傳音視頻文件,或者在個人計算機或者移動計算設備上打開音視頻文件。之后,計算設 備提取音視頻文件里的音頻流,將音頻流統一到固定采樣頻率有符號單通道數據。之后采 用預先設定的分幀參數,對數據進行分幀處理。
步驟2:根據各分幀段的能量值計算樣本語音中每個語音片的語音平均能量值和所有 語音片的平均能量值。
語音端點的檢測基于語音的能量值實現,首先要計算單個語音片的語音平均能量值和 所有語音片的平均能量值(每個語音片的語音平均能量值求和后除以語音片的個數)。
步驟3:從所述各分幀段中獲取其能量值超過語音平均能量值和平均能量值的分幀 段,則以該分幀段為句中間幀對該幀的前序幀或后序幀進行掃描,若前序幀或后序幀的能 量閥值小于設定語音平均能量值,則將該幀與所述句中間幀按幀起始順序合并成為獨立 句;若所述獨立句的幀長超出設定獨立幀長,則計算該獨立局每幀的譜熵比,以最低譜熵 比所對應的幀作為分割點,將上述獨立局風格為兩個獨立句。
步驟4:判斷所述獨立句的幀長是否為設定的短句幀長范圍,若是,則將歷史存儲的 短獨立句標本與當前獨立句進行對比,若匹配度低于設定值,則將獨立句標識為噪音句。
步驟5:將所述音頻的各分幀段獲得的未標識為噪音句的獨立句作為音頻的斷句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710670308.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于樹木胸徑測量的圖像采集裝置和系統
- 下一篇:一種輪廓度測量設備





