[發明專利]基于五門限的聲音端點檢測方法及其應用在審
| 申請號: | 201711225920.3 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN107993649A | 公開(公告)日: | 2018-05-04 |
| 發明(設計)人: | 艾竹軒 | 申請(專利權)人: | 無錫同芯微納科技有限公司 |
| 主分類號: | G10L15/05 | 分類號: | G10L15/05 |
| 代理公司: | 南京艾普利德知識產權代理事務所(特殊普通合伙)32297 | 代理人: | 陸明耀,顧祥安 |
| 地址: | 214000 江蘇省無錫市新吳區震*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 門限 聲音 端點 檢測 方法 及其 應用 | ||
技術領域
本發明涉及聲音識別領域,尤其是基于五門限的聲音端點檢測方法及其應用。
背景技術
端點檢測,就是從一段給定的語音信號中找出語音的起始點和結束點。在語音識別系統中,正確、有效的進行端點檢測不僅可以減少計算量和縮短處理時間,而且能排除無聲段的噪聲干擾、提高語音識別的正確率。研究表明,即使是在安靜的環境下,語音識別系統一半以上的錯誤可能主要來源于端點檢測。除此之外,在語音合成、編碼等系統中,高效的端點檢測也直接影響甚至決定著系統的主要性能。因此,端點檢測的效率、質量在語音處理系統中顯得至關重要,廣泛開展端點檢測實現手段方面的研究,有一定的現實意義。
端點檢測的常用方法有:能量閾值、基音檢測、頻譜分析、倒譜分析及LPC(Linear Prediction Coeffi-cients)預測殘差等。其中基于能量和過零率的雙門限判決法最為常用。
普通雙門限檢測法指通過短時能量和短時過零率兩方面來對音樂的起點進行檢測,通過預先設定合理的短時能量門限和過零率門限進行判別,用短時能量來判別音樂的響度特征,用短時過零率來判斷音樂的頻率特征。
其在開始進行端點檢測之前,首先為短時能量和過零率分別確定兩個門限,一個是比較低的門限,其數值比較小,對信號的變化比較敏感,很容易就會被超過;另一個是比較高的門限,其數值比較大,信號必須達到一定的強度,該門限才可能被超過。低門限被超過未必就是語音的開始有可能是時間很短的噪聲引起的。高門限被超過則可以基本確信是由于語音信號引起的。
整個語音信號的端點檢測通常可以分成四段靜音、過渡段、語音段、結束。在靜音段,如果能量或過零率超越了低門限就開始標記起始點,進入過渡段;在過渡段中,由于參數的數值比較小,不能確信是否處于真正的語音段,因此只要兩個參數的數值回落到低門限以下,就將當前狀態恢復到靜音狀態;而如果在過渡段中兩個參數中的任一個超過了高門限,就可以確信進入語音段了,當前狀態處于語音段時,如果兩個參數的數值降低到低門限以下,而且總的計時長度小于最短時間門限,則認為這是一段噪音,繼續掃描以后的語音數據,否則就標記好結束端點。
這種方法通過上述兩個門限進行綜合判定,從而減小了對一些能量大的噪音的誤判,但是只從以上兩點來對音樂起點進行判斷,其端點識別的精確度的提升是有限的,還有改進的余地。
發明內容
本發明的目的就是為了解決現有技術中存在的上述問題,通過五門限來進行聲音信號中有效音段起點精確識別的端點檢測方法及其應用。
本發明的目的通過以下技術方案來實現:
基于五門限的聲音端點檢測方法,包括如下步驟:
S1,接收分幀預處理后的聲音信號;
S2,判斷一幀信號的平均幀能量差與平均幀能量差低門限、平均幀能量差高門限的大小以及平均幀過零率與平均幀過零率低門限的大小;
S3,當判斷第一幀信號的平均幀能量差>平均幀能量差高門限,則該幀信號進入有效音段,音樂長度加1,執行S4步驟;
當判斷第一幀信號的平均幀能量差<平均幀能量差低門限和/或平均幀過零率<平均幀過零率低門限,則該幀信號處于靜音段,執行S7步驟;
當判斷第一幀信號滿足平均幀能量差低門限≤平均幀能量差≤平均幀能量差高門限,且平均幀過零率≥平均幀過零率低門限,則該幀信號處于過渡段,執行S8步驟;
S4,判斷下一幀信號的平均幀能量差和平均幀過零率小于零是否成立;;若不成立,該幀信號還處于有效音段,音樂長度加1,執行S4步驟;若成立,執行S5步驟;
S5,判斷該幀信號前的音樂長度是否大于最小音樂長度,若小于,則前面檢測出的有效音段是噪音,音樂長度清零,按照S2步驟繼續判斷下一幀信號的狀態;若大于等于,則滿足跳變條件,執行S6步驟;
S6,判斷下一幀信號的平均幀能量差≥平均幀能量差低門限是否成立;若否,該幀信號處于靜音段,執行S7步驟,若是,該幀信號處于過渡段,執行S8步驟;
S7,依照S2步驟判斷下一幀信號的狀態,并根據S3步驟的判斷原則確定該幀的狀態;
S8,依照S2步驟判斷下一幀信號的狀態,當該幀信號不滿足平均幀能量差低門限≤平均幀能量差≤平均幀能量差高門限,且平均幀過零率≥平均幀過零率低門限,該幀信號維持在靜音段,執行S7步驟;當該幀信號滿足平均幀能量差低門限≤平均幀能量差≤平均幀能量差高門限,且平均幀過零率≥平均幀過零率低門限時,執行S9步驟;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫同芯微納科技有限公司,未經無錫同芯微納科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711225920.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種無人機識別方法、裝置及電子設備
- 下一篇:用于生成信息的方法和裝置





