[發(fā)明專利]語音控制系統(tǒng)、方法和裝置以及計算設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910325459.1 | 申請日: | 2019-04-22 |
| 公開(公告)號: | CN111833863B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 韓翀蛟;羅奎;章偉明;陳宣雍;刁宏鋒 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22 |
| 代理公司: | 北京展翼知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11452 | 代理人: | 屠長存 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 控制系統(tǒng) 方法 裝置 以及 計算 設(shè)備 存儲 介質(zhì) | ||
公開了一種語音控制系統(tǒng)、方法和裝置以及計算設(shè)備和存儲介質(zhì)。該語音控制方法包括:獲取來自至少兩個智能設(shè)備的特征數(shù)據(jù),所述特征數(shù)據(jù)用于確定所述智能設(shè)備與語音發(fā)出者之間的距離;基于所述特征數(shù)據(jù),確定所述至少兩個智能設(shè)備各自與所述語音發(fā)出者之間的距離或能夠表征所述距離的參數(shù);基于所述距離或參數(shù)確定對應(yīng)于所述至少兩個智能設(shè)備的語音控制決策;以及向所述至少兩個智能設(shè)備發(fā)送對應(yīng)于其語音控制決策的控制指令。由此,通過控制使得處于至少兩個智能設(shè)備的拾音范圍內(nèi)的語音被唯一響應(yīng),以解決多臺智能設(shè)備同時被喚醒帶來的用戶體驗問題。
技術(shù)領(lǐng)域
本公開涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種語音控制系統(tǒng)、方法和裝置以及計算設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著信息技術(shù)的飛速發(fā)展,越來越多的智能語音設(shè)備被投入使用,用戶通過簡單的語音喚醒即可喚醒相關(guān)智能語音設(shè)備,為用戶生活提供了更多便利。但是,當(dāng)用戶處于多臺智能語音設(shè)備拾音范圍內(nèi)時,這多臺智能語音設(shè)備均會采集到用戶的語音,并分別被喚醒而與用戶進行交互,導(dǎo)致多臺智能語音設(shè)備的應(yīng)答音頻重疊,影響用戶體驗。
因此,需要一種改進的語音控制策略,以解決上述問題。
發(fā)明內(nèi)容
本公開的目的是提供一種語音控制系統(tǒng)及語音控制方法和裝置,以解決多臺智能語音設(shè)備同時被喚醒帶來的用戶體驗問題。
根據(jù)本公開的第一個方面,提供了一種語音控制方法,該方法包括:獲取來自至少兩個智能設(shè)備的特征數(shù)據(jù),所述特征數(shù)據(jù)用于確定所述智能設(shè)備與語音發(fā)出者之間的距離;基于所述特征數(shù)據(jù),確定所述至少兩個智能設(shè)備各自與所述語音發(fā)出者之間的距離或能夠表征所述距離的參數(shù);基于所述距離或參數(shù)確定對應(yīng)于所述至少兩個智能設(shè)備的語音控制決策;以及向所述至少兩個智能設(shè)備發(fā)送對應(yīng)于其語音控制決策的控制指令。
可選地,所述語音控制決策可以包括:使距離所述語音發(fā)出者最近的智能設(shè)備允許被喚醒;或者使除了距離所述語音發(fā)出者最近的智能設(shè)備以外的智能設(shè)備禁止被喚醒。
可選地,該方法還可以包括:以一個已接收到其發(fā)送的特征數(shù)據(jù)、并且尚未向其發(fā)送禁止被喚醒的控制指令的智能設(shè)備作為第一智能設(shè)備;獲取不同于所述第一智能設(shè)備的第二智能設(shè)備響應(yīng)于同一語音的特征數(shù)據(jù);向所述第一智能設(shè)備和所述第二智能設(shè)備中距離所述語音發(fā)出者較遠的智能設(shè)備發(fā)送禁止被喚醒的控制指令,并以所述第一智能設(shè)備和所述第二智能設(shè)備中距離所述用戶較近的智能設(shè)備為新的第一智能設(shè)備。
可選地,在滿足預(yù)定條件的情況下,向第一智能設(shè)備發(fā)送喚醒控制指令。
可選地,該方法還包括:針對同一語音,在向第一智能設(shè)備發(fā)送喚醒控制指令之后,在獲取到來自其它智能設(shè)備的特征數(shù)據(jù)的情況下,向所述其它智能設(shè)備發(fā)送禁止被喚醒的控制指令。
可選地,所述預(yù)定條件包括如下的至少一項:針對同一語音,從接收到第一個智能設(shè)備發(fā)送的特征數(shù)據(jù)起達到預(yù)設(shè)的決策時間;針對同一語音,在預(yù)定時間段內(nèi)未接收到來自智能設(shè)備的特征數(shù)據(jù)。
可選地,所述方法由服務(wù)器和/或決策終端執(zhí)行,所述決策終端為多個智能設(shè)備中的一個智能設(shè)備,所述決策終端能夠與其它智能設(shè)備通信,所述服務(wù)器與所述多個智能設(shè)備之間基于無線通信網(wǎng)絡(luò)通信;并且/或者所述多個智能設(shè)備之間基于本地局域網(wǎng)通信。
可選地,所述服務(wù)器和/或所述決策終端獲取來自至少兩個智能設(shè)備的特征數(shù)據(jù),并向所述至少兩個智能設(shè)備發(fā)送對應(yīng)于其語音控制決策的控制指令,所述智能設(shè)備執(zhí)行先接收到的所述控制指令。
可選地,該方法還可以包括:向所述多個智能設(shè)備發(fā)送設(shè)備信息表,所述設(shè)備信息表包括被指定為決策終端的智能設(shè)備的設(shè)備信息。
可選地,所述特征數(shù)據(jù)可以包括如下的至少一項:基于所述語音計算得到的喚醒能量值;所采集到的所述語音中的喚醒詞的置信度;采集所述語音時采集到的所述用戶的圖像;采集所述語音時探測到的用戶與智能設(shè)備的距離數(shù)據(jù);以及所述智能設(shè)備的WiFi信道狀態(tài)信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910325459.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





