[發明專利]一種基于多種聲音特征的相似度計算方法有效
| 申請號: | 201710933415.8 | 申請日: | 2017-10-10 |
| 公開(公告)號: | CN107610715B | 公開(公告)日: | 2021-03-02 |
| 發明(設計)人: | 龍華;張琳;邵玉斌;杜慶治 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/24;G10L25/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多種 聲音 特征 相似 計算方法 | ||
本發明涉及一種基于多種聲音特征的相似度計算方法,屬于音頻信號處理技術領域。首先對聲音信號進行預處理,預處理過程包括:預加重、分幀處理、加窗函數,然后提取聲音信號的時域特征、頻域特征、倒譜域特征。時域特征包括:短時平均過零率和短時自相關函數;頻域特征包括:短時功率譜密度函數;倒譜域特征包括:梅爾頻率倒譜系數和線性預測倒譜系數。分別針對提取的音頻特征進行相似度值的計算,通過對待測音頻特征分別做互相關的方法,得到每一種特征參數計算的相似度值。
技術領域
本發明涉及一種基于多種聲音特征的相似度計算方法,屬于音頻信號處理技術領域。
背景技術
在語音識別、語音內容相似性判別系統中,特征提取過程就是抽取保持語音最重要特征,并消除與語音無關信號的干擾。特征參數的選擇直接影響著相似性判別的準確率。本發明分別提取時域特征參數、頻域特征參數、倒譜域特征參數,因不同特征參數表征的音頻信息不同,對相似性判別的貢獻不同,對此,為了能夠有效準確的比較待測音頻的相似性,使以特征參數判別相似性的方法具有更好的魯棒性,提出了對不同特征參數計算的相似度值線性加權的方法。
發明內容
本發明要解決的技術問題是提供一種基于多種聲音特征的相似度計算方法,分別通過時域特征參數、頻域特征參數、倒譜域特征參數進行音頻信號相似度的計算,并對不同特征參數計算的結果進行線性加權。
本發明的技術方案是:一種基于多種聲音特征的相似度計算方法,包括以下步驟:
(1)預處理:預處理過程分為三個步驟:預加重處理、分幀處理、加窗函數;
(2)提取特征參數:分別提取表征音頻信號信息的時域特征,頻域特征,倒譜域特征;
(3)相似度值計算:分別計算每種特征參數的相似度值;
(4)相似度值線性加權:把每一種特征參數計算的相似度值進行線性加權,通過試驗方法,確定權重系數,從而確定待測音頻的相似度。
上述的一種基于多種聲音特征的相似度計算方法,步驟(1)中預處理,其中把待測音頻信號進行分幀處理:音頻序列是時間軸上的一維信號,為了能夠對其進行信號分析,需要假設音頻信號在毫秒級別的短時間處于穩定狀態,因此在此基礎上對音頻信號進行分幀操作。對音頻信號分幀處理可采用連續分段的方法,但為了使幀與幀之間平滑過渡保持其連續性,一般會采用交疊分段的方法。分幀是用可移動的有限長度窗口進行加權的方法來實現的,也就是用一定的窗函數w(n)來乘音頻信號s(n),從而形成加窗的音頻信號sw(n)=s(n)×w(n)。
設待測的音頻信號分別為s(n)和s*(n),經過預處理后的信號為si(n)和其中下標i分別表示分幀后的第i幀。信號s(n)和s*(n)具有相同的采樣率,量化精度,時間長度。在本發明中,幀長設為256點,約20.48ms,幀移128點,音頻信號的采樣率為44.1KHz,待測音頻信號均分為m幀,i的取值范圍為[1,m];
上述的一種基于多種聲音特征的相似度計算方法,步驟(2)中提取特征參數,提取的特征參數有時域、頻域、倒譜域特征參數。時域特征參數有短時平均過零率和短時自相關函數,頻域特征參數有短時功率譜密度函數,倒譜域特征參數有梅爾頻率倒譜系數(MFCC)和線性預測倒譜系數(LPCC)。
對每一幀信號si(n)和分別提取短時平均過零率、短時自相關函數、短時功率譜密度函數、梅爾頻率倒譜系數(MFCC)和線性預測倒譜系數(LPCC)。
(1)短時平均過零率:待測音頻信號每一幀的短時平均過零率分別為xi和則m幀的短時平均過零率則組成了短時平均過零率序列{xi}和分別用符號X(i)和X*(i)表示,下標i表示第i幀,待測音頻序列共被分為m幀;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710933415.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于時延估計的回聲消除方法及裝置
- 下一篇:多媒體信息檢測方法及裝置





