[發(fā)明專利]提取語音信號的韻律特征的方法和裝置無效
| 申請?zhí)枺?/td> | 200910168513.2 | 申請日: | 2009-08-21 |
| 公開(公告)號: | CN101996628A | 公開(公告)日: | 2011-03-30 |
| 發(fā)明(設(shè)計)人: | 劉昆;吳偉國 | 申請(專利權(quán))人: | 索尼株式會社 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 朱勝;陳煒 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 提取 語音 信號 韻律 特征 方法 裝置 | ||
1.一種提取語音信號的韻律特征的方法,包括:
對語音信號進(jìn)行分幀;
對語音幀進(jìn)行時域到頻域的變換;
針對不同的頻段,計算相應(yīng)的韻律特征;以及其中,針對不同的頻段計算相應(yīng)的韻律特征包括以下處理中的一項(xiàng)或多項(xiàng):
針對第一頻段計算語音信號的厚度特征,其中所述厚度特征基于在第一頻段的頻域能量;
針對第二頻段計算語音信號的力度特征,其中所述力度特征基于在第二頻段的時域能量;以及
針對第三頻段計算語音信號的層次特征,其中所述層次特征基于在第三頻段的時域包絡(luò)。
2.根據(jù)權(quán)利要求1所述的方法,其中,針對第一頻段計算語音信號的厚度特征進(jìn)一步包括:基于第一頻段上所有譜單元對應(yīng)的幅度譜來計算所述厚度特征。
3.根據(jù)權(quán)利要求1所述的方法,其中,針對第二頻段計算語音信號的力度特征進(jìn)一步包括:
針對第二頻段,通過逆濾波得到該頻段的時域信號;以及
基于所述時域信號的各個采樣點(diǎn)的振幅來計算所述力度特征。
4.根據(jù)權(quán)利要求1所述的方法,其中,針對第三頻段計算語音信號的層次特征進(jìn)一步包括:
針對第三頻段,通過逆濾波得到該頻段的時域信號;
對逆濾波之后得到的時域信號進(jìn)行希爾波特變換,以得到對應(yīng)的希爾波特變換信號;以及
基于所述時域信號和所述希爾波特變換信號來計算所述層次特征。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述第一頻段的范圍為0-150Hz,所述第二頻段的范圍為150-500Hz,所述第三頻段的范圍為500Hz-5KHz。
6.根據(jù)權(quán)利要求1所述的方法,其中對語音幀進(jìn)行時域到頻域的變換是通過傅立葉變換來實(shí)現(xiàn)的。
7.根據(jù)權(quán)利要求1所述的方法,其中,針對不同的頻段計算相應(yīng)的韻律特征是以每幀為基礎(chǔ)進(jìn)行的;以及所述方法進(jìn)一步包括:針對每個韻律特征,計算當(dāng)前幀特征、當(dāng)前幀特征與前一幀特征的差值以及當(dāng)前幀特征與當(dāng)前幀所在段特征均值的差值。
8.一種將根據(jù)權(quán)利要求1所述的方法提取的韻律特征與傳統(tǒng)聲學(xué)特征結(jié)合使用的方法,包括:
對每一幀提取傳統(tǒng)聲學(xué)特征;
針對所述韻律特征,分別計算當(dāng)前幀特征、當(dāng)前幀特征與前一幀特征的差值以及當(dāng)前幀特征與當(dāng)前幀所在段特征均值的差值;
提取每一幀的基頻、該基頻與前一幀基頻的差值、該基頻與當(dāng)前幀所在段基頻均值的差值;以及
將上述各個特征相結(jié)合并應(yīng)用于說話人識別中。
9.根據(jù)權(quán)利要求8所述的方法,其中所述傳統(tǒng)聲學(xué)特征包括美兒倒譜系數(shù)、線性預(yù)測倒譜系數(shù)和線譜頻率中的一種或多種。
10.一種提取語音信號的韻律特征的裝置,包括:
分幀單元,用于對語音信號進(jìn)行分幀;
時域到頻域變換單元,用于對語音幀進(jìn)行時域到頻域的變換;
韻律特征計算單元,用于針對不同的頻段,計算相應(yīng)的韻律特征;以及其中,韻律特征計算單元進(jìn)一步包括以下單元中的一個或多個:
厚度特征計算單元,用于針對第一頻段計算語音信號的厚度特征,其中所述厚度特征基于在第一頻段的頻域能量;
力度特征計算單元,用于針對第二頻段計算語音信號的力度特征,其中所述力度特征基于在第二頻段的時域能量;以及
層次特征計算單元,用于針對第三頻段計算語音信號的層次特征,其中所述層次特征基于在第三頻段的時域包絡(luò)。
11.根據(jù)權(quán)利要求10所述的裝置,其中,所述厚度特征計算單元基于第一頻段上所有譜單元對應(yīng)的幅度譜來計算所述厚度特征。
12.根據(jù)權(quán)利要求10所述的裝置,其中,所述力度特征計算單元針對第二頻段,通過逆濾波得到該頻段的時域信號,并且基于所述時域信號的各個采樣點(diǎn)的振幅來計算所述力度特征。
13.根據(jù)權(quán)利要求10所述的裝置,其中,所述層次特征計算單元針對第三頻段,通過逆濾波得到該頻段的時域信號,對所述時域信號進(jìn)行希爾波特變換以得到對應(yīng)的希爾波特變換信號,并且基于所述時域信號和所述希爾波特變換信號來計算所述層次特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼株式會社,未經(jīng)索尼株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910168513.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:燃?xì)鉅t具備用爐頭結(jié)構(gòu)
- 下一篇:一種太陽能庭院燈
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 亮度信號/色信號分離裝置和亮度信號/色信號分離方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 雙耳信號的信號生成
- 雙耳信號的信號生成
- 信號處理裝置、信號處理方法、信號處理程序
- USBTYPEC信號轉(zhuǎn)HDMI信號的信號轉(zhuǎn)換線
- 信號盒(信號轉(zhuǎn)換)
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置





