[發(fā)明專利]語音識別方法、裝置及終端有效
| 申請?zhí)枺?/td> | 201610063803.0 | 申請日: | 2016-01-29 |
| 公開(公告)號: | CN105679321B | 公開(公告)日: | 2020-05-19 |
| 發(fā)明(設(shè)計)人: | 黎小松;傅文治;胡績強;汪平煒 | 申請(專利權(quán))人: | 宇龍計算機通信科技(深圳)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 工業(yè)和信息化部電子專利中心 11010 | 代理人: | 梁軍 |
| 地址: | 518057 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 方法 裝置 終端 | ||
1.一種語音識別方法,其特征在于,包括:
獲取一幀語音信號,從所述語音信號中提取d維MFCC參數(shù);
對d維所述MFCC參數(shù)進行倒譜計算,獲得d維倒譜MFCC參數(shù);
根據(jù)預(yù)設(shè)的迭代次數(shù)對各維所述倒譜MFCC參數(shù)進行迭代處理,獲得d維迭代倒譜MFCC參數(shù);
基于d維所述迭代倒譜MFCC參數(shù),對所述語音信號進行識別;
采用下述公式進行迭代處理,獲得d維所述迭代倒譜MFCC參數(shù):
其中,i為迭代次數(shù),α為扭曲因子,C0′(n+1)為迭代初值,
C′1(n+1)為迭代次數(shù)為1次時的第n+1維倒譜參數(shù),或者為迭代次數(shù)為1次時特征補償?shù)牡趎+1維倒譜MFCC參數(shù),
C′i-1(n+1)為迭代次數(shù)為i-1次時第n+1維倒譜參數(shù),或者為迭代次數(shù)為i-1次時特征補償?shù)牡趎+1維倒譜MFCC參數(shù),
C′i(n+1)為迭代次數(shù)為i次時第n+1維倒譜參數(shù),或者為迭代次數(shù)為第i次時特征補償?shù)牡趎+1維倒譜MFCC參數(shù),
C′i-1(n)為迭代次數(shù)為i-1次時第n維倒譜參數(shù),或者為迭代次數(shù)為i-1次時,特征補償?shù)牡趎維倒譜MFCC參數(shù)。
2.如權(quán)利要求1所述的方法,其特征在于,基于d維所述迭代倒譜MFCC參數(shù),對所述語音信號進行識別的步驟,具體包括:
對d維所述迭代倒譜MFCC參數(shù)采用差分方式獲得d個特征補償值;
根據(jù)d個所述特征補償值,對d維所述迭代倒譜MFCC參數(shù)進行特征補償;
基于經(jīng)過特征補償?shù)乃龅棺VMFCC參數(shù),對所述語音信號進行識別。
3.如權(quán)利要求2所述的方法,其特征在于,基于經(jīng)過特征補償?shù)乃龅棺VMFCC參數(shù),對所述語音信號進行識別的步驟,具體包括:
對經(jīng)過特征補償?shù)乃龅棺VMFCC參數(shù),采用主成分分析方式進行降維處理;
基于降維處理后的所述迭代倒譜MFCC參數(shù),對所述語音信號進行識別。
4.一種語音識別裝置,其特征在于,包括:
參數(shù)提取模塊,用于獲取一幀語音信號,從所述語音信號中提取d維MFCC參數(shù);
倒譜模塊,用于對d維所述MFCC參數(shù)進行倒譜計算,獲得d維倒譜MFCC參數(shù);
迭代模塊,用于根據(jù)預(yù)設(shè)的迭代次數(shù)對各維所述倒譜MFCC參數(shù)進行迭代處理,獲得d維迭代倒譜MFCC參數(shù);
識別模塊,用于基于d維所述迭代倒譜MFCC參數(shù),對所述語音信號進行識別;
采用下述公式進行迭代處理,獲得d維所述迭代倒譜MFCC參數(shù):
其中,i為迭代次數(shù),α為扭曲因子,C0′(n+1)為迭代初值,
C′1(n+1)為迭代次數(shù)為1次時的第n+1維倒譜參數(shù),或者為迭代次數(shù)為1次時特征補償?shù)牡趎+1維倒譜MFCC參數(shù),
C′i-1(n+1)為迭代次數(shù)為i-1次時第n+1維倒譜參數(shù),或者為迭代次數(shù)為i-1次時特征補償?shù)牡趎+1維倒譜MFCC參數(shù),
C′i(n+1)為迭代次數(shù)為i次時第n+1維倒譜參數(shù),或者為迭代次數(shù)為第i次時特征補償?shù)牡趎+1維倒譜MFCC參數(shù),
C′i-1(n)為迭代次數(shù)為i-1次時第n維倒譜參數(shù),或者為迭代次數(shù)為i-1次時,特征補償?shù)牡趎維倒譜MFCC參數(shù)。
5.如權(quán)利要求4所述的裝置,其特征在于,所述識別模塊包括特征補償單元和識別單元,
所述特征補償單元,用于對d維所述迭代倒譜MFCC參數(shù)采用差分方式獲得d個特征補償值;
根據(jù)d個所述特征補償值,對d維所述迭代倒譜MFCC參數(shù)進行特征補償;
所述識別單元,用于基于經(jīng)過特征補償?shù)乃龅棺VMFCC參數(shù),對所述語音信號進行識別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于宇龍計算機通信科技(深圳)有限公司,未經(jīng)宇龍計算機通信科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610063803.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種聲紋識別相似度評分的方法和裝置
- 下一篇:移動終端和降噪方法





