[發(fā)明專利]語(yǔ)音特征信息的提取方法及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201410074866.7 | 申請(qǐng)日: | 2014-03-03 |
| 公開(kāi)(公告)號(hào): | CN104900227A | 公開(kāi)(公告)日: | 2015-09-09 |
| 發(fā)明(設(shè)計(jì))人: | 廖安華;彭剛 | 申請(qǐng)(專利權(quán))人: | 聯(lián)想(北京)有限公司 |
| 主分類號(hào): | G10L15/02 | 分類號(hào): | G10L15/02;G10L19/26 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 100085 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 特征 信息 提取 方法 電子設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音特征信息的提取方法及電子設(shè)備。
背景技術(shù)
隨著語(yǔ)音技術(shù)的飛速發(fā)展,能夠通過(guò)多種方法來(lái)提取語(yǔ)音信息的特征矢量,例如可以通過(guò)有線性預(yù)測(cè)系數(shù)(LPC),LPC倒譜系數(shù)(LPCC)和Mel頻譜系統(tǒng)(Mel-scale?Frequency?Cepstral?Coefficients,簡(jiǎn)稱MFCC))來(lái)提取語(yǔ)音特征矢量,具有較好的識(shí)別性能和抗噪能力。
但是,現(xiàn)有電子設(shè)備在提取語(yǔ)音特征信息時(shí),是根據(jù)人耳對(duì)不同頻率的聲波有不同的聽(tīng)覺(jué)敏感度,從低頻到高頻這一段頻帶內(nèi)按臨界帶寬的大小由密到疏安排三角帶通濾波器的,然后再對(duì)輸入信號(hào)進(jìn)行濾波,使得三角帶通濾波器組固定分布,且在低頻時(shí)設(shè)置的三角帶通濾波器的數(shù)量較大,以及在高頻時(shí)設(shè)置的三角帶通濾波器的數(shù)量較少,而在語(yǔ)音信息中的信息在高頻時(shí)攜帶有更多的信息量時(shí),而三角帶通濾波器組固定分布,使得高頻設(shè)置的三角帶通濾波器的數(shù)量較少,如此,使得現(xiàn)有的電子設(shè)備在獲取語(yǔ)音特征信息時(shí),存在三角帶通濾波器組固定分布,不能根據(jù)實(shí)際情況自動(dòng)調(diào)整的技術(shù)問(wèn)題。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例通過(guò)提供一種語(yǔ)音特征信息的提取方法及電子設(shè)備,用以解決現(xiàn)有的電子設(shè)備在獲取語(yǔ)音特征信息時(shí),存在不能根據(jù)實(shí)際情況自動(dòng)調(diào)整三角帶通濾波器組的分布的技術(shù)問(wèn)題。
本申請(qǐng)實(shí)施例提供了一種語(yǔ)音特征信息的提取方法,應(yīng)用于電子設(shè)備中,所述方法包括:
獲取語(yǔ)音信息;
獲取所述語(yǔ)音信息在與所述語(yǔ)音信息對(duì)應(yīng)頻率寬度中的信息分布參數(shù);
基于所述信息分布參數(shù),確定三角帶通濾波器組在頻譜上的分布系數(shù),所述頻譜與所述語(yǔ)音信息對(duì)應(yīng);
根據(jù)所述分布系數(shù),將三角帶通濾波器組分布在所述頻譜上進(jìn)行濾波,獲取Mel頻譜;
基于所述Mel頻譜,獲取Mel頻率倒譜系數(shù)MFCC。
可選的,所述獲取所述語(yǔ)音信息在與所述語(yǔ)音信息對(duì)應(yīng)頻率寬度中的信息分布參數(shù),具體包括:對(duì)所述語(yǔ)音信息依次進(jìn)行預(yù)加重、分幀、加窗戶和快速傅里葉變換FFT處理,獲取與所述語(yǔ)音信息對(duì)應(yīng)的頻譜信息;基于所述頻譜信息,確定所述信息分布參數(shù)。
可選的,所述基于所述頻譜信息,確定所述信息分布參數(shù),具體包括:對(duì)所述頻譜信息進(jìn)行功率分析,獲取所述功率分布參數(shù);基于所述功率分布參數(shù),確定所述信息分布參數(shù)。
可選的,所述基于所述Mel頻譜,獲取Mel頻率倒譜系數(shù)MFCC,具體包括:將所述Mel頻譜取對(duì)數(shù),獲得對(duì)數(shù)能量譜;將所述對(duì)數(shù)能量譜進(jìn)行離散余弦變換DCT,獲得所述MFCC。
可選的,所述基于所述信息分布參數(shù),確定三角帶通濾波器組在頻譜上的分布系數(shù),具體包括:基于所述信息分布參數(shù),將所述頻率帶寬劃分為N個(gè)頻帶,并確定三角帶通濾波器組在所述N個(gè)頻帶中的每個(gè)頻帶上的分布系數(shù),其中,N為不小于2的整數(shù)。
可選的,所述基于所述信息分布參數(shù),確定三角帶通濾波器組在頻譜上的分布系數(shù),具體包括:基于所述信息分布參數(shù),將所述頻率帶寬劃分為所述N個(gè)頻帶,以及確定三角帶通濾波器組在所述N個(gè)頻帶中的每個(gè)頻帶上的分布系數(shù),其中,所述N個(gè)頻帶中的第一頻帶攜帶的第一信息量大于所述N個(gè)頻帶中的第二頻帶攜帶的第二信息量時(shí),分布在所述第一頻帶中的三角帶通濾波器組的第一數(shù)量大于分布在所述第二頻帶中的三角帶通濾波器組的第二數(shù)量。
本申請(qǐng)一實(shí)施例還提供了一種電子設(shè)備,所述電子設(shè)備包括:
語(yǔ)音信息獲取單元,用于獲取語(yǔ)音信息;
信息參數(shù)獲取單元,用于獲取所述語(yǔ)音信息在與所述語(yǔ)音信息對(duì)應(yīng)頻率寬度中的信息分布參數(shù);
分布系數(shù)確定單元,用于基于所述信息分布參數(shù),確定三角帶通濾波器組在頻譜上的分布系數(shù),所述頻譜與所述語(yǔ)音信息對(duì)應(yīng);
Mel頻譜獲取單元,用于根據(jù)所述分布系數(shù),將三角帶通濾波器組分布在所述頻譜上進(jìn)行濾波,獲取Mel頻譜;
MFCC獲取單元,用于基于所述Mel頻譜,獲取所述MFCC。
可選的,所述電子設(shè)備包括頻譜信息獲取單元,用于對(duì)所述語(yǔ)音信息依次進(jìn)行預(yù)加重、分幀、加窗戶和快速傅里葉變換FFT處理,獲取與所述語(yǔ)音信息對(duì)應(yīng)的頻譜信息;
所述信息參數(shù)獲取單元,具體用于基于所述頻譜信息,確定所述信息分布參數(shù)。
可選的,所述信息參數(shù)獲取單元,具體用于對(duì)所述頻譜信息進(jìn)行功率分析,獲取所述功率分布參數(shù),再基于所述功率分布參數(shù),確定所述信息分布參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于聯(lián)想(北京)有限公司,未經(jīng)聯(lián)想(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410074866.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





