[發明專利]一種改進的多個病理單元音識別方法有效
| 申請號: | 201910233952.0 | 申請日: | 2019-03-26 |
| 公開(公告)號: | CN110070894B | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 張濤;武雅琴 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G10L25/66 | 分類號: | G10L25/66;G10L25/30 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 杜文茹 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 改進 病理 元音 識別 方法 | ||
1.一種改進的多個病理單元音識別方法,其特征在于,包括如下步驟:
1)計算輸入語音信號的線譜對參數;
2)計算輸入語音信號的相鄰差分線譜對參數;
3)對輸入語音信號的線譜對參數進行頻率彎折,得到輸入語音信號的巴克線譜對參數;所述的頻率彎折是采用如下公式:
Bark=26.81/(1+(1960/f))-0.53 (6)
式中,Bark表示Bark頻率;f表示線性頻率;
4)根據相鄰差分線譜對參數對輸入語音信號的巴克線譜對參數進行特征增強得到增強型巴克線譜對參數;
5)將輸入語音信號的增強型巴克線譜對參數輸入到深度神經網絡分類器中進行多個病理單元音的識別。
2.根據權利要求1所述的一種改進的多個病理單元音識別方法,其特征在于,步驟1)包括:
(1.1)進行信號預處理,包括去直流處理和分幀處理;
(1.2)對于每幀語音信號,根據設置的模型階數p=12采用萊文遜-杜賓自相關算法計算12階線性預測系數ai;
(1.3)由(1.2)計算得到的線性預測系數ai計算得到線性預測逆濾波器系統函數,如下:
式中,A(z)表示線性預測逆濾波器系統函數;p表示模型階數;ai表示線性預測系數;
(1.4)計算線性預測逆濾波器系統函數A(z)的p+1階對稱和反對稱多項式:
P(z)=A(z)+z-(p+1)A(z-1) (2)
式中,P(z)表示A(z)的p+1階對稱多項式,A(z)表示線性預測逆濾波器系統函數;p表示模型階數;
Q(z)=A(z)-z-(p+1)A(z-1) (3)
式中,Q(z)表示A(z)的p+1階反對稱多項式,A(z)表示線性預測逆濾波器系統函數;p表示模型階數;
(1.5)由P(z)和Q(z)計算12階輸入語音信號的線譜對參數:
式中,H(ejω)是線性預測頻譜幅值,ejω是z的頻率表示形式,P(ejω)是A(ejω)的p+1階對稱多項式,Q(ejω)是A(ejω)的p+1階反對稱多項式,cosθi和cosωi是LSP系數在余弦域的表示,θi和ωi是輸入語音信號的線譜對系數對應的線譜頻率,Π是累乘符號。
3.根據權利要求1所述的一種改進的多個病理單元音識別方法,其特征在于,步驟2)是根據如下公式計算:
DALi=li+1-li,i=1,2,...M(M<N) (5)
式中,DALi是第i階相鄰差分線譜對參數,li+1第i+1階線譜對參數,li第i階線譜對參數,M是相鄰差分線譜對參數最大階數,N是線譜對參數最大階數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910233952.0/1.html,轉載請聲明來源鉆瓜專利網。





