[發(fā)明專利]語音識別方法和裝置有效
| 申請?zhí)枺?/td> | 201511000520.3 | 申請日: | 2015-12-28 |
| 公開(公告)號: | CN105679314B | 公開(公告)日: | 2020-05-22 |
| 發(fā)明(設(shè)計)人: | 程強;蔣正翔;萬廣魯 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/065;G10L15/22;G10L15/34 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 方法 裝置 | ||
1.一種語音識別方法,其特征在于,包括:
接收待識別的語音信號;
確定所述語音信號屬于的領(lǐng)域;
根據(jù)預(yù)先建立的領(lǐng)域和與語音識別模型的對應(yīng)關(guān)系,確定與所述語音信號屬于的領(lǐng)域?qū)?yīng)的語音識別模型;
后臺切換為所述領(lǐng)域?qū)?yīng)的語音識別模型,并采用所述語音識別模型對所述語音信號進行語音識別;
所述接收待識別的語音信號,包括:
以語音交互的方式向用戶詢問當前交互階段的信息;
接收用戶語音輸入的回復(fù)信息,將所述回復(fù)信息確定為所述待識別的語音信號;
所述確定所述語音信號屬于的領(lǐng)域,包括:
根據(jù)所述當前交互階段的信息屬于的領(lǐng)域,確定為所述語音信號屬于的領(lǐng)域。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
收集不同領(lǐng)域的語料;
根據(jù)不同領(lǐng)域的語料進行訓練,生成對應(yīng)領(lǐng)域的語音識別模型;
建立領(lǐng)域與語音識別模型的對應(yīng)關(guān)系,以根據(jù)所述對應(yīng)關(guān)系獲取不同領(lǐng)域的語音識別模型。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在采用所述語音識別模型對所述語音信號進行語音識別后得到第一語音識別結(jié)果,所述方法還包括:
采用通用語音識別模型對所述語音信號進行語音識別,得到第二語音識別結(jié)果;
從所述第一語音識別結(jié)果和所述第二語音識別結(jié)果中選擇最優(yōu)的語音識別結(jié)果,將所述最優(yōu)的語音識別結(jié)果作為最終的語音識別結(jié)果進行輸出。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述語音信號屬于的領(lǐng)域是一個或多個。
5.一種語音識別裝置,其特征在于,包括:
接收模塊,用于接收待識別的語音信號;
確定模塊,用于確定所述語音信號屬于的領(lǐng)域,并根據(jù)預(yù)先建立的領(lǐng)域和與語音識別模型的對應(yīng)關(guān)系,確定與所述語音信號屬于的領(lǐng)域?qū)?yīng)的語音識別模型;
第一識別模塊,用于將后臺切換為所述領(lǐng)域?qū)?yīng)的語音識別模型,并采用所述語音識別模型對所述語音信號進行語音識別;
所述接收模塊具體用于:
以語音交互的方式向用戶詢問當前交互階段的信息;
接收用戶語音輸入的回復(fù)信息,將所述回復(fù)信息確定為所述待識別的語音信號;
所述確定模塊具體用于:
根據(jù)所述當前交互階段的信息屬于的領(lǐng)域,確定為所述語音信號屬于的領(lǐng)域。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,還包括:
訓練模塊,用于收集不同領(lǐng)域的語料;根據(jù)不同領(lǐng)域的語料進行訓練,生成對應(yīng)領(lǐng)域的語音識別模型;以及,建立領(lǐng)域與語音識別模型的對應(yīng)關(guān)系,以根據(jù)所述對應(yīng)關(guān)系獲取不同領(lǐng)域的語音識別模型。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,在采用所述語音識別模型對所述語音信號進行語音識別后得到第一語音識別結(jié)果,所述裝置還包括:
第二識別模塊,用于采用通用語音識別模型對所述語音信號進行語音識別,得到第二語音識別結(jié)果;
選擇模塊,用于從所述第一語音識別結(jié)果和所述第二語音識別結(jié)果中選擇最優(yōu)的語音識別結(jié)果,將所述最優(yōu)的語音識別結(jié)果作為最終的語音識別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201511000520.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





