[發(fā)明專利]一種自適應調(diào)整語音識別率的方法及裝置在審
| 申請?zhí)枺?/td> | 201410734498.4 | 申請日: | 2014-12-04 |
| 公開(公告)號: | CN105719644A | 公開(公告)日: | 2016-06-29 |
| 發(fā)明(設計)人: | 呂榮國 | 申請(專利權(quán))人: | 中興通訊股份有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L21/02 |
| 代理公司: | 北京元本知識產(chǎn)權(quán)代理事務所 11308 | 代理人: | 秦力軍 |
| 地址: | 518057 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自適應 調(diào)整 語音 識別率 方法 裝置 | ||
技術(shù)領域
本發(fā)明涉及終端語音識別技術(shù),特別涉及一種自適應調(diào)整語音識別率的方法 及相關(guān)的裝置。
背景技術(shù)
移動終端(例如手機)的發(fā)展日新月異,使用場景越來越復雜,語音識別功 能因為可以徹底解放雙手而成為移動終端發(fā)展的一大特色。
現(xiàn)有技術(shù)的語音識別基本都是集中在語音識別功能的實現(xiàn)上,基本都是采用 雙麥克實現(xiàn)降噪,一個麥克作為主聲道麥克,拾取有用聲源數(shù)據(jù),另一個麥克拾 取背景噪聲。兩個麥克通常需要在物理上隔離開,所以在硬件布局上兩個麥克分 布在主板的兩側(cè)。為了實現(xiàn)更好的降噪效果,兩個麥克在移動終端中通常位于同 一條垂直線上。但這種雙麥克主動降噪也有其缺點,可能會影響正常的拾音質(zhì)量, 比如兩個麥克隔離不好或者距離太近又或者兩個話筒的參數(shù)不完全一致,就可能 導致有用音源也抵消一部分拾音,導致有用音源得不到有效加強;另外,由于人 的聲音是在一定頻率范圍內(nèi)的,由于干涉作用,不同音頻范圍的聲波可能在到達 兩個麥克時相位剛好相反,此時疊加起來該頻段就被消除掉,頻率響應不是平直 的,因此聲音發(fā)悶。這些雙麥克降噪的不足對語音識別性能提升有巨大的影響。
進一步地,語音識別成功率對背景噪聲環(huán)境依賴較高,但在高噪聲環(huán)境下操 作移動終端是不可避免的,這樣就導致了高噪聲環(huán)境下識別成功率低,難以發(fā)揮 其作用的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種自適應調(diào)整語音識別率的方法及裝置,能更好地 解決在高背景噪聲下保證較高語音識別成功率的問題。
根據(jù)本發(fā)明的一個方面,提供了一種自適應調(diào)整語音識別率的方法,包括:
終端在通過采集用戶語音數(shù)據(jù)得到用戶語音流的同時,對環(huán)境噪聲進行噪聲 全方位采集,得到全方位噪聲數(shù)據(jù)流;
根據(jù)所得到的全方位噪聲數(shù)據(jù)流,確定降噪系數(shù);
利用所得到的全方位噪聲數(shù)據(jù)流和所確定的降噪系數(shù),對用戶語音流進行降 噪處理,消除用戶語音流中的環(huán)境噪聲;
對已消除環(huán)境噪聲的用戶語音流進行語音識別。
優(yōu)選地,在終端表面設置多個麥克,其中一個麥克用來采集用戶語音數(shù)據(jù), 其余麥克用來全方位采集噪聲。
優(yōu)選地,在終端表面設置四個麥克,其中,兩個麥克位于終端正面的兩個對 角位置,其余兩個麥克位于終端反面的另外兩個對角位置。
優(yōu)選地,在根據(jù)所得到的全方位噪聲數(shù)據(jù)流,確定降噪系數(shù)的步驟之前還包 括:
終端根據(jù)對環(huán)境噪聲進行噪聲全方位采集而得到的全方位噪聲數(shù)據(jù)流,判定 所采集的環(huán)境噪聲中是否存在非穩(wěn)態(tài)噪聲;
當判定所采集的環(huán)境噪聲中存在非穩(wěn)態(tài)噪聲時,消除用戶語音流和全方位噪 聲數(shù)據(jù)流中的非穩(wěn)態(tài)噪聲。
優(yōu)選地,在所述確定降噪系數(shù)期間,還包括:根據(jù)所得到的全方位噪聲數(shù)據(jù) 流,確定揚聲器響度系數(shù),以利用所確定的揚聲器響度系數(shù),調(diào)整終端揚聲器輸 出響度。
優(yōu)選地,還包括:
終端根據(jù)對環(huán)境噪聲進行噪聲全方位采集而得到的全方位噪聲數(shù)據(jù)流,判定 所述環(huán)境噪聲是環(huán)繞噪聲或單邊噪聲;
當判定所述環(huán)境噪聲是單邊噪聲時,將遠離噪聲源的麥克關(guān)閉。
根據(jù)本發(fā)明的另一方面,提供了一種自適應調(diào)整語音識別率的裝置,包括:
音頻獲取模塊,用于在通過采集用戶語音數(shù)據(jù)得到用戶語音流的同時,對環(huán) 境噪聲進行噪聲全方位采集,得到全方位噪聲數(shù)據(jù)流;
參數(shù)確定模塊,用于根據(jù)所得到的全方位噪聲數(shù)據(jù)流,確定降噪系數(shù);
音頻處理模塊,用于利用所得到的全方位噪聲數(shù)據(jù)流和所確定的降噪系數(shù), 對用戶語音流進行降噪處理,消除用戶語音流中的環(huán)境噪聲;
語音識別模塊,用于對已消除環(huán)境噪聲的用戶語音流進行語音識別。
優(yōu)選地,所述音頻獲取模塊包括在終端表面設置的多個麥克,其中一個麥克 用來采集用戶語音數(shù)據(jù),其余麥克用來全方位采集噪聲。
優(yōu)選地,所述音頻獲取模塊包括在終端表面設置的四個麥克,其中,兩個麥 克位于終端正面的兩個對角位置,其余兩個麥克位于終端反面的另外兩個對角位 置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中興通訊股份有限公司,未經(jīng)中興通訊股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410734498.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:液壓傳動出渣方法及出渣機
- 下一篇:GSM信號頻點檢測方法及其裝置
- 色相調(diào)整系統(tǒng)及其調(diào)整方法
- 調(diào)整設備和調(diào)整方法
- 踏板調(diào)整結(jié)構(gòu)及調(diào)整步態(tài)的調(diào)整方法
- 立體深度調(diào)整和焦點調(diào)整
- 調(diào)整裝置及其調(diào)整方法
- 噴嘴調(diào)整工具及調(diào)整方法
- 調(diào)整系統(tǒng)及調(diào)整方法
- 調(diào)整裝置以及調(diào)整方法
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 功率調(diào)整器(調(diào)整)
- 基于反識別渲染的文本內(nèi)容識別率測試方法及裝置
- 音段切分檢測方法及系統(tǒng)、口語評測方法及系統(tǒng)
- 一種冠字號識別率確定方法及裝置
- 一種基于分子光譜分析的定性模型評估方法和系統(tǒng)
- 從非結(jié)構(gòu)化文本中提取特征詞的方法及系統(tǒng)、計算機程序
- 一種人臉識別系統(tǒng)的自我糾正方法、系統(tǒng)及設備
- 權(quán)重精度配置方法、裝置、設備及存儲介質(zhì)
- 一種基于卷積神經(jīng)網(wǎng)絡的中藥材識別方法
- 用于訓練集的噪聲數(shù)據(jù)修改方法、裝置和電子設備
- 用于訓練集的噪聲數(shù)據(jù)識別方法、裝置和電子設備





