[發(fā)明專利]語音識別方法、裝置以及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202110055546.7 | 申請日: | 2021-01-15 |
| 公開(公告)號: | CN112863487A | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計(jì))人: | 許偉亮;鄧建龍 | 申請(專利權(quán))人: | 廣東優(yōu)碧勝科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L25/24 |
| 代理公司: | 北京匯思誠業(yè)知識產(chǎn)權(quán)代理有限公司 11444 | 代理人: | 朱娟 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 方法 裝置 以及 電子設(shè)備 | ||
本申請實(shí)施例提供一種語音識別方法、裝置以及電子設(shè)備,所述方法包括:獲取待識別語音信號;對所述語音信號進(jìn)行特征提取,獲得第一數(shù)量的第一特征和第二數(shù)量的第二特征;基于所述第一數(shù)量的第一特征,獲得第一數(shù)量的第一線性判別比;基于所述第二數(shù)量的第二特征,獲得第二數(shù)量的第二線性判別比;對所述第一數(shù)量的第一線性判別比進(jìn)行篩選,得到第三數(shù)量的第一線性判別比,確定第三數(shù)量的第一特征;對所述第二數(shù)量的第二線性判別比進(jìn)行篩選,得到第四數(shù)量的第二線性判別比,確定第四數(shù)量的第二特征;將所述第三數(shù)量的第一特征和所述第四數(shù)量的第二特征與預(yù)設(shè)語音特征樣本進(jìn)行匹配,獲得識別結(jié)果。
技術(shù)領(lǐng)域
本申請涉及語音識別技術(shù)領(lǐng)域,特別涉及一種語音識別方法、裝置以及電子設(shè)備。
背景技術(shù)
在智能化潮流的背景下,智能語音設(shè)備如語音機(jī)器人、人機(jī)交互設(shè)備等,廣泛地應(yīng)用于家居、餐廳、工作、車輛等領(lǐng)域。通常情況下,在人機(jī)交互時,用戶需要發(fā)出喚醒語音(如喚醒詞等),以喚醒智能語音設(shè)備。因此,喚醒語音的識別是作為人機(jī)交互的重要環(huán)節(jié)之一。特別在餐廳等環(huán)境中,環(huán)境噪聲比較復(fù)雜,如何準(zhǔn)確地識別出喚醒語音是提高人機(jī)交互體驗(yàn)的問題之一。
目前市場上,現(xiàn)有技術(shù)中喚醒語音識別中提取的特征數(shù)據(jù)較多,特別對于餐廳中環(huán)境噪聲較為復(fù)雜的情況下,需借助強(qiáng)大的云端平臺進(jìn)行數(shù)據(jù)分析,大大地增加了成本,不利于實(shí)際產(chǎn)品落地。
另外,現(xiàn)有技術(shù)的語音識別方法中利用MFCC語音特征進(jìn)行語音識別,該方法僅適合在高頻區(qū)間內(nèi)識別語音特征,無法全面地識別語音特征,易導(dǎo)致部分低頻語音無法識別的現(xiàn)象,人機(jī)交互體驗(yàn)較差。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N語音識別方法、裝置以及電子設(shè)備,能夠更全面地識別語音特征,并去除不穩(wěn)定特征,有利于提高語音識別率,提高人機(jī)交互體驗(yàn)。
第一方面,本申請?zhí)峁┝艘环N語音識別方法,包括:
獲取語音信號;
對所述語音信號進(jìn)行特征提取,獲得第一數(shù)量的第一特征和第二數(shù)量的第二特征;
基于所述第一數(shù)量的第一特征,獲得第一數(shù)量的第一線性判別比;
基于所述第二數(shù)量的第二特征,獲得第二數(shù)量的第二線性判別比;
對所述第一數(shù)量的第一線性判別比進(jìn)行篩選,得到第三數(shù)量的第一線性判別比,所述第三數(shù)量小于所述第一數(shù)量;
對所述第二數(shù)量的第二線性判別比進(jìn)行篩選,得到第四數(shù)量的第二線性判別比,所述第四數(shù)量小于所述第二數(shù)量;
基于所述第三數(shù)量的第一線性判別比,確定第三數(shù)量的第一特征;
基于所述第四數(shù)量的第二線性判別比,確定第四數(shù)量的第二特征;
將所述第三數(shù)量的第一特征和所述第四數(shù)量的第二特征與預(yù)設(shè)語音特征樣本進(jìn)行匹配,獲得識別結(jié)果。
其中一種可能的實(shí)現(xiàn)方式中,所述對所述第一數(shù)量的第一線性判別比進(jìn)行篩選,得到第三數(shù)量的第一線性判別比,所述第三數(shù)量小于所述第一數(shù)量,包括:
確定所述第一數(shù)量的第一線性判別比中第一線性判別比最大值和最小值;
選取所述第一數(shù)量的第一線性判別比中除所述第一線性判別比最大值和最小值以外的第一線性判別比,以得到第三數(shù)量的第一線性判別比;
和/或,所述對所述第二數(shù)量的第二線性判別比進(jìn)行篩選,得到第四數(shù)量的第二線性判別比,所述第四數(shù)量小于所述第二數(shù)量,包括:
確定所述第二數(shù)量的第二線性判別比中第二線性判別比最大值和最小值;
選取所述第二數(shù)量的第二線性判別比中除所述第二線性判別比最大值和最小值以外的第二線性判別比,以得到第四數(shù)量的第二線性判別比。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東優(yōu)碧勝科技有限公司,未經(jīng)廣東優(yōu)碧勝科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110055546.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





