[發(fā)明專利]一種智能設備喚醒方法及裝置在審
| 申請?zhí)枺?/td> | 201911098662.6 | 申請日: | 2019-11-12 |
| 公開(公告)號: | CN112863500A | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設計)人: | 杜國威 | 申請(專利權(quán))人: | 北京安云世紀科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22 |
| 代理公司: | 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 11006 | 代理人: | 王玉雙 |
| 地址: | 100102 北京市朝陽區(qū)酒仙橋路*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 智能 設備 喚醒 方法 裝置 | ||
本發(fā)明公開了一種智能設備的喚醒方法及裝置,所述方法包括:獲取語音數(shù)據(jù);識別所述語音數(shù)據(jù)的語速快慢,獲得語音語速;根據(jù)所述語音語速,確定識別策略;基于所述識別策略對所述語音數(shù)據(jù)進行喚醒詞的識別,獲得識別結(jié)果;若所述識別結(jié)果為識別到預設的喚醒詞,則喚醒所述智能設備。本發(fā)明解決了現(xiàn)有的語音智能設備容易出現(xiàn)無法喚醒和誤喚醒的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別及人工智能技術(shù)領(lǐng)域,尤其涉及一種智能設備喚醒方法及裝置。
背景技術(shù)
對于如智能音箱的這類可進行語音交互的智能設備,往往在未使用的時候是處于休眠狀態(tài),以此進行節(jié)能、避免浪費電量。在需要進行使用的時候需要先對智能音箱進行喚醒,喚醒的常用方式為語音喚醒。語音喚醒時,用戶可直接說出預設的激活詞來喚醒音箱,例如:“天貓精靈”,“小愛同學”,“若琪”等。當智能音箱識別到預設的激活詞時就會啟動智能音箱的大多數(shù)或全部功能進行工作,完成用戶下達的相關(guān)指令。
目前為了避免誤喚醒,一般將喚醒詞設置為4個音節(jié)。但當用戶以較快的語速說出喚醒詞時,會導致喚醒詞的表述較為模糊,識別成功率嚴重下降,出現(xiàn)無法喚醒的情況。
發(fā)明內(nèi)容
鑒于上述問題,本發(fā)明提出了一種智能設備喚醒方法及裝置,解決了現(xiàn)有的語音智能設備容易出現(xiàn)無法喚醒或誤喚醒的問題。
第一方面,本申請通過一實施例提供如下技術(shù)方案:
一種智能設備的喚醒方法,應用于智能設備中,所述方法包括:
獲取語音數(shù)據(jù);識別所述語音數(shù)據(jù)的語速快慢,獲得語音語速;根據(jù)所述語音語速,確定識別策略;基于所述識別策略對所述語音數(shù)據(jù)進行識別,獲得識別結(jié)果;若所述識別結(jié)果為識別到預設的喚醒詞,則喚醒所述智能設備。
優(yōu)選地,所述識別策略包括所述語音數(shù)據(jù)的各字節(jié)對應的識別標準,所述識別標準為所述語音數(shù)據(jù)的字節(jié)與所述喚醒詞的字節(jié)匹配成功的最低相似度,所述基于所述識別策略對所述語音數(shù)據(jù)進行識別,獲得識別結(jié)果,包括:
比對所述語音數(shù)據(jù)的字節(jié)與所述喚醒詞的字節(jié),獲得字節(jié)相似度;比較所述字節(jié)相似度與所述識別標準,獲得所述識別結(jié)果。
優(yōu)選地,所述識別策略包括:第一識別標準、第二識別標準和第三識別標準,其中,所述第一識別標準高于所述第二識別標準,所述第二識別標準高于所述第三識別標準。
優(yōu)選地,所述根據(jù)所述語音語速,確定識別策略,包括:
將所述語音語速與預設的語速進行比較;當所述語音語速比所述預設的語速快時,確定對所述語音數(shù)據(jù)的首尾兩端的字節(jié)進行識別的識別標準為所述第一識別標準。
優(yōu)選地,所述根據(jù)所述語音語速,確定識別策略,包括:
將所述語音語速與預設的語速進行比較;當所述語音語速比所述預設的語速快時,確定對所述語音數(shù)據(jù)的首尾兩端的字節(jié)進行識別的識別標準為所述第二識別標準;此時,所述基于所述識別策略對所述語音數(shù)據(jù)進行識別包括:若識別到所述喚醒詞的首字節(jié)和尾字節(jié),則將所述語音數(shù)據(jù)上傳至服務器,以使得所述服務器對所述語音數(shù)據(jù)的首尾兩端的字節(jié)進行識別。
優(yōu)選地,所述將所述語音語速與預設的語速進行比較之后,還包括:
當所述語音語速比所述預設的語速快時,確定對所述首尾兩端之間的字節(jié)進行識別的識別標準為所述第三識別標準。
優(yōu)選地,所述將所述語音語速與預設的語速進行比較之后,還包括:
當所述語音語速比所述預設的語速慢時,或當所述語音語速和所述預設的語速相等時,確定對所述語音數(shù)據(jù)的所有字節(jié)進行識別的識別標準為所述第二識別標準。
優(yōu)選地,所述識別所述語音數(shù)據(jù)的語速快慢,獲得語音語速,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京安云世紀科技有限公司,未經(jīng)北京安云世紀科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911098662.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





