[發(fā)明專利]語音喚醒方法和裝置在審

申請?zhí)枺?/td>	201810133876.1	申請日：	2018-02-09
公開（公告）號：	CN108335696A	公開（公告）日：	2018-07-27
發(fā)明（設(shè)計）人：	李俊;楊銳;趙立峰;陳曉建;曹玉書	申請（專利權(quán)）人：	百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/197;G10L15/16;G10L15/06;G10L15/32;G10L15/30
代理公司：	北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204	代理人：	王達(dá)佐;馬曉亞
地址：	100085 北京市***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	喚醒音信息語音信息方法和裝置判斷結(jié)果置信度語音接收用戶智能設(shè)備驗證響應(yīng) 概率申請
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例公開了語音喚醒方法和裝置。該方法的一具體實施方式包括：接收用戶的語音信息；基于所述語音信息得到對應(yīng)于所述語音信息的喚醒置信度；根據(jù)所述喚醒置信度確定所述語音信息是否為疑似喚醒語音信息；響應(yīng)于確定所述語音信息為疑似喚醒語音信息，對所述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果，根據(jù)所述二次判斷結(jié)果確定是否執(zhí)行喚醒操作。該實施方式實現(xiàn)了語音信息的二次驗證，降低了智能設(shè)備被誤喚醒的概率。

技術(shù)領(lǐng)域

本申請實施例涉及計算機技術(shù)領(lǐng)域，具體涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域，尤其涉及語音喚醒方法和裝置。

背景技術(shù)

隨著人工智能技術(shù)的發(fā)展和語音技術(shù)的逐漸成熟，以對話式為主的類人式對話交互正在成為一種新型的交互革新，并逐步實現(xiàn)產(chǎn)品化，例如，智能機器人、智能音箱、智能電視、智能冰箱等等，這些智能設(shè)備可以將人們的雙手從觸摸式交互中解放出來。

在一些場景下，用戶可以使用喚醒語音對智能設(shè)備進(jìn)行喚醒，之后智能設(shè)備能夠?qū)τ脩舻恼Z音指令進(jìn)行響應(yīng)。

發(fā)明內(nèi)容

本申請實施例提出了語音喚醒方法和裝置。

第一方面，本申請實施例提供了一種語音喚醒方法，包括：接收用戶的語音信息；基于上述語音信息得到對應(yīng)于上述語音信息的喚醒置信度；根據(jù)上述喚醒置信度確定上述語音信息是否為疑似喚醒語音信息；響應(yīng)于確定上述語音信息為疑似喚醒語音信息，對上述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果，根據(jù)上述二次判斷結(jié)果確定是否執(zhí)行喚醒操作。

在一些實施例中，基于上述語音信息得到對應(yīng)于上述語音信息的喚醒置信度，包括：將上述語音信息輸入預(yù)先建立的識別模型，得到針對上述語音信息的喚醒置信度，其中，上述識別模型用于表征語音信息與喚醒置信度的對應(yīng)關(guān)系。

在一些實施例中，上述識別模型為神經(jīng)網(wǎng)絡(luò)模型，上述神經(jīng)網(wǎng)絡(luò)模型是通過以下方式訓(xùn)練得到的：獲取樣本集合，其中，樣本包括樣本語音信息和樣本語音信息是否為喚醒語音信息的標(biāo)注信息；執(zhí)行以下訓(xùn)練步驟：將上述樣本集合中的至少一個樣本語音信息分別輸入至初始神經(jīng)網(wǎng)絡(luò)模型，得到上述至少一個樣本語音信息中的每個樣本語音信息對應(yīng)的預(yù)測信息，其中，預(yù)測信息表征樣本語音信息為喚醒語音信息的概率；將上述至少一個樣本語音信息中的每個樣本語音信息對應(yīng)的預(yù)測信息與標(biāo)注信息進(jìn)行比較；根據(jù)比較結(jié)果確定上述初始神經(jīng)網(wǎng)絡(luò)模型是否達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo)；響應(yīng)于確定上述初始神經(jīng)網(wǎng)絡(luò)模型達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo)，將上述初始神經(jīng)網(wǎng)絡(luò)模型作為訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型。

在一些實施例中，訓(xùn)練上述神經(jīng)網(wǎng)絡(luò)模型的步驟還包括：響應(yīng)于確定上述初始神經(jīng)網(wǎng)絡(luò)模型未達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo)，調(diào)整上述初始神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù)，以及繼續(xù)執(zhí)行上述訓(xùn)練步驟。

在一些實施例中，上述標(biāo)注信息包括第一標(biāo)識和第二標(biāo)識，其中，第一標(biāo)識表征是喚醒語音信息，第二標(biāo)識表征不是喚醒語音信息。

在一些實施例中，上述二次判斷結(jié)果包括確認(rèn)喚醒和確認(rèn)不喚醒；以及上述對上述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果，根據(jù)上述二次判斷結(jié)果確定是否執(zhí)行喚醒操作，包括：將上述語音信息發(fā)送到服務(wù)端，由上述服務(wù)端根據(jù)上述語音信息生成二次判斷結(jié)果；接收上述二次判斷結(jié)果；響應(yīng)于確定上述二次判斷結(jié)果為確認(rèn)喚醒，執(zhí)行喚醒操作。

第二方面，本申請實施例又提供了一種語音喚醒方法，包括：接收終端發(fā)送的疑似喚醒語音信息；將上述疑似喚醒語音信息進(jìn)行語音識別，得到語音識別結(jié)果；將上述語音識別結(jié)果與上述終端的目標(biāo)喚醒詞進(jìn)行匹配；根據(jù)匹配結(jié)果向上述終端發(fā)送二次判斷結(jié)果，由上述終端根據(jù)上述二次判斷結(jié)果確定是否執(zhí)行喚醒操作，其中，上述二次判斷結(jié)果包括確認(rèn)喚醒或確認(rèn)不喚醒。

在一些實施例中，上述根據(jù)匹配結(jié)果向上述終端發(fā)送二次判斷結(jié)果，包括：響應(yīng)于確定上述語音識別結(jié)果與上述目標(biāo)喚醒詞匹配成功，向上述終端發(fā)送確認(rèn)喚醒；響應(yīng)于確定上述語音識別結(jié)果與上述目標(biāo)喚醒詞匹配不成功，向上述終端發(fā)送確認(rèn)不喚醒。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司，未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810133876.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】