[發明專利]一種基于特征融合的語音聲效模式檢測方法有效
| 申請號: | 201710172671.X | 申請日: | 2017-03-21 |
| 公開(公告)號: | CN107039046B | 公開(公告)日: | 2020-03-10 |
| 發明(設計)人: | 晁浩;智慧來;劉永利;劉志中;魯保云;余瓊霞 | 申請(專利權)人: | 河南理工大學 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/18;G10L25/24;G10L25/51 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 454000 河南*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 特征 融合 語音 模式 檢測 方法 | ||
1.一種基于特征融合的語音聲效模式檢測方法,其特征在于包括如下步驟:
步驟1、接收語音信號;
步驟2、檢測出所述語音信號中的元音,生成元音集合;
步驟3、提取所述元音集合中每一個元音的譜特征矢量序列;
步驟4、提取所述元音集合中每一個元音的頻率特征矢量序列;
步驟5、根據所述元音集合中每一個元音的譜特征矢量序列和頻率特征矢量序列生成該元音的聲效特征矢量序列;
步驟6、根據所述元音集合中每一個元音的聲效特征矢量序列將所述元音集合分別與多個候選聲效模式進行匹配,生成每一個候選聲效模式的匹配值;
步驟7、將匹配值最大的候選聲效模式確定為所述語音信號的聲效模式。
2.根據權利要求1所述的語音聲效模式檢測方法,其特征在于所述步驟4中提取所述元音集合中每一個元音的頻率特征矢量序列的具體步驟如下:
步驟41、對該元音對應的語音信號加漢寧窗,得到語音幀序列;
步驟42、采用伽馬通濾波器組對所述語音信號進行濾波,得到多個帶通信號;
步驟43、計算每一個帶通信號的分析信號,所述分析信號通過如下公式獲取:
其中yk(n)表示所述多個帶通信號中第k個帶通信號,sk(n)表示yk(n)的分析信號,表示所述帶通信號yk(n)經過希爾伯特變換得到的值;
步驟44、計算每一個分析信號的瞬時幅值和瞬時相位,并根據所述瞬時相位計算該分析信號的瞬時頻率;
步驟45、通過如下公式計算所述語音幀序列中每一幀的頻率特征矢量:
其中,i表示所述語音幀序列中的第i幀,F(i)表示第i幀的頻率特征矢量,表示F(i)的第k個分量,N表示所述伽馬通濾波器組包含的濾波器的數量,n0表示第i幀的起始采樣點,τ表示第i幀的長度,ak(n)表示分析信號sk(n)的瞬時幅值,fk(n)表示分析信號sk(n)的瞬時頻率。
3.根據權利要求2所述的語音聲效模式檢測方法,其特征在于所述步驟5中根據所述元音集合中每一個元音的譜特征矢量序列和頻率特征矢量序列生成該元音的聲效特征矢量序列的具體過程如下:
步驟51、將該元音每一幀的譜特征矢量和頻率特征矢量相連接,生成該幀的總體特征矢量;
步驟52、利用主成份分析方法對該元音的總體特征矢量序列進行降維,得到該元音的聲效特征矢量序列。
4.根據權利要求2或3所述的語音聲效模式檢測方法,其特征在于所述步驟6中每一個候選聲效模式的匹配值通過如下公式確定:
其中,VE表示該候選聲效模式,M(VE)表示該候選聲效模式的匹配值,Vset表示所述元音集合,v表示所述元音集合Vset中的某個元音,P(VE|v)表示元音v屬于候選聲效模式VE的概率。
5.根據權利要求4所述的語音聲效模式檢測方法,其特征在于所述步驟6中元音v屬于所述候選聲效模式VE的概率P(VE|v)的計算過程如下:
步驟61、從所述候選聲效模式VE預置的概率模型集合中獲取所述元音v對應的概率模型;
步驟62、將所述元音v的聲效特征序列輸入到所述元音v對應的概率模型,得到所述元音v屬于所述候選聲效模式VE的概率P(VE|v)。
6.根據權利要求5所述的語音聲效模式檢測方法,其特征在于所述元音v對應的概率模型為隱馬爾可夫模型。
7.根據權利要求6所述的語音聲效模式檢測方法,其特征在于所述步驟3中的譜特征矢量序列為梅爾頻率倒譜系數矢量序列。
8.根據權利要求7所述的語音聲效模式檢測方法,其特征在于所述步驟42中伽馬通濾波器組包含的濾波器數量為27。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南理工大學,未經河南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710172671.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種無氧細胞培養裝置
- 下一篇:一種適用于培養箱的顯示面板





