[發明專利]語音激活檢測方法、裝置及計算機可讀存儲介質有效
| 申請號: | 201910920618.2 | 申請日: | 2019-09-26 |
| 公開(公告)號: | CN110580913B | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 謝鑫;張楠賡 | 申請(專利權)人: | 嘉楠明芯(北京)科技有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/78 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 任巖 |
| 地址: | 100094 北京市海淀區東北旺西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 激活 檢測 方法 裝置 計算機 可讀 存儲 介質 | ||
1.一種語音激活檢測方法,其特征在于,包括:
獲取待檢測數據的幅值特征;以及
根據所述幅值特征對所述待檢測數據進行語音激活檢測;
若所述幅值特征大于等于一幅值門限,則檢測到語音;
若所述幅值特征小于一幅值門限,則獲取短時幅值差特征,根據所述短時幅值差特征對所述待檢測數據進行語音激活檢測。
2.根據權利要求1所述的語音激活檢測方法,其特征在于,在獲取待檢測數據的幅值特征之前,還包括:
確定信噪比;
若所述信噪比大于等于一信噪比閾值則獲取短時幅值特征,若所述信噪比小于一信噪比閾值則獲取所述幅值特征。
3.根據權利要求2所述的語音激活檢測方法,其特征在于,所述方法還包括:
根據所述短時幅值特征對所述待檢測數據進行語音激活檢測,若所述短時幅值特征大于等于一短時幅值門限,則檢測到語音。
4.根據權利要求1所述的語音激活檢測方法,其特征在于,根據所述短時幅值差特征對所述待檢測數據進行語音激活檢測,包括:若所述短時幅值差特征大于等于一短時幅值差門限,則檢測到語音。
5.根據權利要求3所述的語音激活檢測方法,其特征在于,所述短時幅值特征及短時幅值門限分別滿足以下關系式:
STABSTh(m)=STABSTh(m-1)×α+STABS(m)×(1-α);
其中,STABS(m)表示第m幀的短時幅值特征,STABSTh(m)表示第m幀的短時幅值門限,n表示采樣點序號,x(n)表示當前采樣點的采樣值,m表示幀的計數序號,M表示一幀數據包含的采樣點個數,α表示遺忘因子,STABSTh(m-1)表示第m-1幀的短時幅值門限。
6.根據權利要求5所述的語音激活檢測方法,其特征在于,若起始幀m=0,則STABSTh(0)=STABS(0)。
7.根據權利要求1所述的語音激活檢測方法,其特征在于,所述幅值特征及幅值門限分別滿足以下關系式:
ABS(n)=|x(n)|;
若ABS(n)*Rou>ABSTh(n-1),則ABSTh(n)=ABSTh(n-1)+β;否則ABSTh(n)=ABSTh(n-1)-β2;
其中,ABS(n)表示幅值特征,ABSTh(n)表示第n個采樣點的幅值門限,n表示采樣點序號,x(n)表示當前采樣點的采樣值,Rou表示更新倍數,β表示向上修正值,ABSTh(n-1)表示第n-1個采樣點的幅值門限,x(n-1)表示第n-1個采樣點的采樣值,β2表示向下修正值。
8.根據權利要求1所述的語音激活檢測方法,其特征在于,所述短時幅值差特征及短時幅值差門限分別滿足以下關系式:
DSTABSTh(m)=DSTABSTh(m-1)×α2+DSTABS(m)×(1-α2);
其中,DSTABS(m)表示短時幅值差特征,DSTABSTh(m)表示第m幀的短時幅值差門限,n表示采樣點序號,x(n)表示當前采樣點的采樣值,m表示幀的計數序號,M表示一幀數據包含的采樣點個數,α2表示遺忘因子,DSTABSTh(m-1)表示第m-1幀的短時幅值差門限。
9.根據權利要求8所述的語音激活檢測方法,其特征在于,若起始幀m=0,則短時幅值差門限DSTABSTh(0)=DSTABS(0)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于嘉楠明芯(北京)科技有限公司,未經嘉楠明芯(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910920618.2/1.html,轉載請聲明來源鉆瓜專利網。





