[發(fā)明專利]語音喚醒方法和裝置在審
| 申請?zhí)枺?/td> | 201810133876.1 | 申請日: | 2018-02-09 |
| 公開(公告)號: | CN108335696A | 公開(公告)日: | 2018-07-27 |
| 發(fā)明(設(shè)計)人: | 李俊;楊銳;趙立峰;陳曉建;曹玉書 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/197;G10L15/16;G10L15/06;G10L15/32;G10L15/30 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 喚醒 音信息 語音信息 方法和裝置 判斷結(jié)果 置信度 語音 接收用戶 智能設(shè)備 驗證 響應(yīng) 概率 申請 | ||
本申請實施例公開了語音喚醒方法和裝置。該方法的一具體實施方式包括:接收用戶的語音信息;基于所述語音信息得到對應(yīng)于所述語音信息的喚醒置信度;根據(jù)所述喚醒置信度確定所述語音信息是否為疑似喚醒語音信息;響應(yīng)于確定所述語音信息為疑似喚醒語音信息,對所述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果,根據(jù)所述二次判斷結(jié)果確定是否執(zhí)行喚醒操作。該實施方式實現(xiàn)了語音信息的二次驗證,降低了智能設(shè)備被誤喚醒的概率。
技術(shù)領(lǐng)域
本申請實施例涉及計算機技術(shù)領(lǐng)域,具體涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及語音喚醒方法和裝置。
背景技術(shù)
隨著人工智能技術(shù)的發(fā)展和語音技術(shù)的逐漸成熟,以對話式為主的類人式對話交互正在成為一種新型的交互革新,并逐步實現(xiàn)產(chǎn)品化,例如,智能機器人、智能音箱、智能電視、智能冰箱等等,這些智能設(shè)備可以將人們的雙手從觸摸式交互中解放出來。
在一些場景下,用戶可以使用喚醒語音對智能設(shè)備進(jìn)行喚醒,之后智能設(shè)備能夠?qū)τ脩舻恼Z音指令進(jìn)行響應(yīng)。
發(fā)明內(nèi)容
本申請實施例提出了語音喚醒方法和裝置。
第一方面,本申請實施例提供了一種語音喚醒方法,包括:接收用戶的語音信息;基于上述語音信息得到對應(yīng)于上述語音信息的喚醒置信度;根據(jù)上述喚醒置信度確定上述語音信息是否為疑似喚醒語音信息;響應(yīng)于確定上述語音信息為疑似喚醒語音信息,對上述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果,根據(jù)上述二次判斷結(jié)果確定是否執(zhí)行喚醒操作。
在一些實施例中,基于上述語音信息得到對應(yīng)于上述語音信息的喚醒置信度,包括:將上述語音信息輸入預(yù)先建立的識別模型,得到針對上述語音信息的喚醒置信度,其中,上述識別模型用于表征語音信息與喚醒置信度的對應(yīng)關(guān)系。
在一些實施例中,上述識別模型為神經(jīng)網(wǎng)絡(luò)模型,上述神經(jīng)網(wǎng)絡(luò)模型是通過以下方式訓(xùn)練得到的:獲取樣本集合,其中,樣本包括樣本語音信息和樣本語音信息是否為喚醒語音信息的標(biāo)注信息;執(zhí)行以下訓(xùn)練步驟:將上述樣本集合中的至少一個樣本語音信息分別輸入至初始神經(jīng)網(wǎng)絡(luò)模型,得到上述至少一個樣本語音信息中的每個樣本語音信息對應(yīng)的預(yù)測信息,其中,預(yù)測信息表征樣本語音信息為喚醒語音信息的概率;將上述至少一個樣本語音信息中的每個樣本語音信息對應(yīng)的預(yù)測信息與標(biāo)注信息進(jìn)行比較;根據(jù)比較結(jié)果確定上述初始神經(jīng)網(wǎng)絡(luò)模型是否達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo);響應(yīng)于確定上述初始神經(jīng)網(wǎng)絡(luò)模型達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo),將上述初始神經(jīng)網(wǎng)絡(luò)模型作為訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型。
在一些實施例中,訓(xùn)練上述神經(jīng)網(wǎng)絡(luò)模型的步驟還包括:響應(yīng)于確定上述初始神經(jīng)網(wǎng)絡(luò)模型未達(dá)到預(yù)設(shè)的優(yōu)化目標(biāo),調(diào)整上述初始神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù),以及繼續(xù)執(zhí)行上述訓(xùn)練步驟。
在一些實施例中,上述標(biāo)注信息包括第一標(biāo)識和第二標(biāo)識,其中,第一標(biāo)識表征是喚醒語音信息,第二標(biāo)識表征不是喚醒語音信息。
在一些實施例中,上述二次判斷結(jié)果包括確認(rèn)喚醒和確認(rèn)不喚醒;以及上述對上述語音信息進(jìn)行二次判斷得到二次判斷結(jié)果,根據(jù)上述二次判斷結(jié)果確定是否執(zhí)行喚醒操作,包括:將上述語音信息發(fā)送到服務(wù)端,由上述服務(wù)端根據(jù)上述語音信息生成二次判斷結(jié)果;接收上述二次判斷結(jié)果;響應(yīng)于確定上述二次判斷結(jié)果為確認(rèn)喚醒,執(zhí)行喚醒操作。
第二方面,本申請實施例又提供了一種語音喚醒方法,包括:接收終端發(fā)送的疑似喚醒語音信息;將上述疑似喚醒語音信息進(jìn)行語音識別,得到語音識別結(jié)果;將上述語音識別結(jié)果與上述終端的目標(biāo)喚醒詞進(jìn)行匹配;根據(jù)匹配結(jié)果向上述終端發(fā)送二次判斷結(jié)果,由上述終端根據(jù)上述二次判斷結(jié)果確定是否執(zhí)行喚醒操作,其中,上述二次判斷結(jié)果包括確認(rèn)喚醒或確認(rèn)不喚醒。
在一些實施例中,上述根據(jù)匹配結(jié)果向上述終端發(fā)送二次判斷結(jié)果,包括:響應(yīng)于確定上述語音識別結(jié)果與上述目標(biāo)喚醒詞匹配成功,向上述終端發(fā)送確認(rèn)喚醒;響應(yīng)于確定上述語音識別結(jié)果與上述目標(biāo)喚醒詞匹配不成功,向上述終端發(fā)送確認(rèn)不喚醒。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810133876.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





