[發(fā)明專利]語音喚醒方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201810133876.1 | 申請(qǐng)日: | 2018-02-09 |
| 公開(公告)號(hào): | CN108335696A | 公開(公告)日: | 2018-07-27 |
| 發(fā)明(設(shè)計(jì))人: | 李俊;楊銳;趙立峰;陳曉建;曹玉書 | 申請(qǐng)(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/197;G10L15/16;G10L15/06;G10L15/32;G10L15/30 |
| 代理公司: | 北京英賽嘉華知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 喚醒 音信息 語音信息 方法和裝置 判斷結(jié)果 置信度 語音 接收用戶 智能設(shè)備 驗(yàn)證 響應(yīng) 概率 申請(qǐng) | ||
1.一種語音喚醒方法,包括:
接收用戶的語音信息;
基于所述語音信息得到對(duì)應(yīng)于所述語音信息的喚醒置信度;
根據(jù)所述喚醒置信度確定所述語音信息是否為疑似喚醒語音信息;
響應(yīng)于確定所述語音信息為疑似喚醒語音信息,對(duì)所述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果,根據(jù)所述二次判斷結(jié)果確定是否執(zhí)行喚醒操作。
2.根據(jù)權(quán)利要求1所述的方法,其中,基于所述語音信息得到對(duì)應(yīng)于所述語音信息的喚醒置信度,包括:
將所述語音信息輸入預(yù)先建立的識(shí)別模型,得到針對(duì)所述語音信息的喚醒置信度,其中,所述識(shí)別模型用于表征語音信息與喚醒置信度的對(duì)應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述識(shí)別模型為神經(jīng)網(wǎng)絡(luò)模型,所述神經(jīng)網(wǎng)絡(luò)模型是通過以下方式訓(xùn)練得到的:
獲取樣本集合,其中,樣本包括樣本語音信息和樣本語音信息是否為喚醒語音信息的標(biāo)注信息;
執(zhí)行以下訓(xùn)練步驟:將所述樣本集合中的至少一個(gè)樣本語音信息分別輸入至初始神經(jīng)網(wǎng)絡(luò)模型,得到所述至少一個(gè)樣本語音信息中的每個(gè)樣本語音信息對(duì)應(yīng)的預(yù)測(cè)信息,其中,預(yù)測(cè)信息表征樣本語音信息為喚醒語音信息的概率;將所述至少一個(gè)樣本語音信息中的每個(gè)樣本語音信息對(duì)應(yīng)的預(yù)測(cè)信息與標(biāo)注信息進(jìn)行比較;根據(jù)比較結(jié)果確定所述初始神經(jīng)網(wǎng)絡(luò)模型是否達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo);響應(yīng)于確定所述初始神經(jīng)網(wǎng)絡(luò)模型達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo),將所述初始神經(jīng)網(wǎng)絡(luò)模型作為訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型。
4.根據(jù)權(quán)利要求3所述的方法,其中,訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)模型的步驟還包括:
響應(yīng)于確定所述初始神經(jīng)網(wǎng)絡(luò)模型未達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo),調(diào)整所述初始神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù),以及繼續(xù)執(zhí)行所述訓(xùn)練步驟。
5.根據(jù)權(quán)利要求3所述的方法,其中,所述標(biāo)注信息包括第一標(biāo)識(shí)和第二標(biāo)識(shí),其中,第一標(biāo)識(shí)表征是喚醒語音信息,第二標(biāo)識(shí)表征不是喚醒語音信息。
6.根據(jù)權(quán)利要求1所述的方法,其中,所述二次判斷結(jié)果包括確認(rèn)喚醒和確認(rèn)不喚醒;以及
所述對(duì)所述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果,根據(jù)所述二次判斷結(jié)果確定是否執(zhí)行喚醒操作,包括:
將所述語音信息發(fā)送到服務(wù)端,由所述服務(wù)端根據(jù)所述語音信息生成二次判斷結(jié)果;
接收所述二次判斷結(jié)果;
響應(yīng)于確定所述二次判斷結(jié)果為確認(rèn)喚醒,執(zhí)行喚醒操作。
7.一種語音喚醒方法,包括:
接收終端發(fā)送的疑似喚醒語音信息;
將所述疑似喚醒語音信息進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果;
將所述語音識(shí)別結(jié)果與所述終端的目標(biāo)喚醒詞進(jìn)行匹配;
根據(jù)匹配結(jié)果向所述終端發(fā)送二次判斷結(jié)果,由所述終端根據(jù)所述二次判斷結(jié)果確定是否執(zhí)行喚醒操作,其中,所述二次判斷結(jié)果包括確認(rèn)喚醒或確認(rèn)不喚醒。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述根據(jù)匹配結(jié)果向所述終端發(fā)送二次判斷結(jié)果,包括:
響應(yīng)于確定所述語音識(shí)別結(jié)果與所述目標(biāo)喚醒詞匹配成功,向所述終端發(fā)送確認(rèn)喚醒;
響應(yīng)于確定所述語音識(shí)別結(jié)果與所述目標(biāo)喚醒詞匹配不成功,向所述終端發(fā)送確認(rèn)不喚醒。
9.一種語音喚醒裝置,包括:
接收單元,用于接收用戶的語音信息;
生成單元,用于基于所述語音信息得到對(duì)應(yīng)于所述語音信息的喚醒置信度;
第一確定單元,用于根據(jù)所述喚醒置信度確定所述語音信息是否為疑似喚醒語音信息;
第二確定單元,用于響應(yīng)于確定所述語音信息為疑似喚醒語音信息,對(duì)所述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果,根據(jù)所述二次判斷結(jié)果確定是否執(zhí)行喚醒操作。
10.根據(jù)權(quán)利要求9所述的裝置,其中,所述生成單元進(jìn)一步用于:
將所述語音信息輸入預(yù)先建立的識(shí)別模型,得到針對(duì)所述語音信息的喚醒置信度,其中,所述識(shí)別模型用于表征語音信息與喚醒置信度的對(duì)應(yīng)關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810133876.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





