[發明專利]一種基于多尺度非線性能量算子的語音信號周期分割方法有效
| 申請號: | 201810640530.0 | 申請日: | 2018-06-21 |
| 公開(公告)號: | CN108830232B | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 朱成華;盧光明;武克斌;張大鵬;鐘德才 | 申請(專利權)人: | 浙江中點人工智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 廣州海藻專利代理事務所(普通合伙) 44386 | 代理人: | 王敏 |
| 地址: | 325025 浙江省溫州市龍灣區*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 非線性 能量 算子 語音 信號 周期 分割 方法 | ||
1.一種基于多尺度非線性能量算子的語音信號周期分割方法,其特征在于,包括以下步驟:
S1、多尺度非線性能量算子TKEO表示為:
Ψ[x(n)]=x(n)2-x(n-1)x(n+1)
其中x(n)為離散語音信號,n代表采樣點;
S2、定義絕對TKEO算子aTKEO(absoluteTKEO):
|Ψ[x(n)]|=|x(n)2-x(n-1)x(n+1)|
S3、將aTKEO擴展至帶尺度參數L的算子RaTKEO,定義如下:
|ΨL[x(n)]|=|x(n)2-x(n-L)x(n+L)|
其中,參數L為正整數;
S4、分別采用最大值融合、乘積融合和均值融合三種融合策略得到以下三個融合值:
其中,M為尺度數,k為尺度,p1(n)表示采用最大值融合時的融合值,最大融合策略對應的聲門閉合時刻(GCI)提取算法為GMATmax;p2(n)表示采用乘積融合時的融合值,乘積整合策略對應的GCI提取算法為GMATprod;p3(n)表示采用均值融合時的融合值;均值融合策略對應的GCI提取算法為GMATmean;
S5、采用下述高通濾波器檢測幅度陡增時刻:
其中j為循環變量,Tl代表計算平均幅度時的窗口大小,q1(n)、q2(n)、q3(n)分別表示采用GMATmax、GMATprod和GMATmean方法時,幅度陡增后與陡增前的平均幅度差值,分別利用q1(n)、q2(n)、q3(n)中的過零點切割出幅度為正的區域,將信號分割成多個區域,且每個區域內包含一個GCI真值,這個區域則為我們分割出來的一個周期;
S6、根據GMATmax、GMATprod和GMATmean方法測出的周期Tmax、Tprod、Tmean,從檢測率、漏檢率、誤檢率、檢測準確度、檢測偏差五個方面評估三種尺度算法的可靠性與準確性,根據對性能要求的不同選擇合適的尺度進行周期分割。
2.根據權利要求1所述的基于多尺度非線性能量算子的語音信號周期分割方法,其特征在于:樣本點x(n-L)或x(n+L)與x(n)的時間距離等于尺度參數L。
3.根據權利要求1所述的基于多尺度非線性能量算子的語音信號周期分割方法,其特征在于:步驟S5中,采用GMATmax方法時,對分割中的每個區域,檢測q1(n)幅度最高時的時刻,并記為n11,同時檢測該區域內p1(n)中幅度最高的三個點,并將這三個點中與n11時間距離最近的點記為n12。
4.根據權利要求3所述的基于多尺度非線性能量算子的語音信號周期分割方法,其特征在于:將n11與n12的平均值作為該區域內的GCI值。
5.根據權利要求1所述的基于多尺度非線性能量算子的語音信號周期分割方法,其特征在于:步驟S5中,采用GMATprod方法時,對分割中的每個區域,檢測q2(n)幅度最高時的時刻,并記為n21,同時檢測該區域內p2(n)中幅度最高的三個點,并將這三個點中與n21時間距離最近的點記為n22。
6.根據權利要求5所述的基于多尺度非線性能量算子的語音信號周期分割方法,其特征在于:將n21與n22的平均值作為該區域內的GCI值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江中點人工智能科技有限公司,未經浙江中點人工智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810640530.0/1.html,轉載請聲明來源鉆瓜專利網。





