[發(fā)明專利]語音控制系統(tǒng)、方法和裝置以及計算設(shè)備和存儲介質(zhì)有效

申請?zhí)枺?/td>	201910325459.1	申請日：	2019-04-22
公開（公告）號：	CN111833863B	公開（公告）日：	2023-04-07
發(fā)明（設(shè)計）人：	韓翀蛟;羅奎;章偉明;陳宣雍;刁宏鋒	申請（專利權(quán)）人：	阿里巴巴集團控股有限公司
主分類號：	G10L15/22	分類號：	G10L15/22
代理公司：	北京展翼知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11452	代理人：	屠長存
地址：	英屬開曼群島大開***	國省代碼：	暫無信息
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音控制系統(tǒng) 方法裝置以及計算設(shè)備存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

公開了一種語音控制系統(tǒng)、方法和裝置以及計算設(shè)備和存儲介質(zhì)。該語音控制方法包括：獲取來自至少兩個智能設(shè)備的特征數(shù)據(jù)，所述特征數(shù)據(jù)用于確定所述智能設(shè)備與語音發(fā)出者之間的距離；基于所述特征數(shù)據(jù)，確定所述至少兩個智能設(shè)備各自與所述語音發(fā)出者之間的距離或能夠表征所述距離的參數(shù)；基于所述距離或參數(shù)確定對應(yīng)于所述至少兩個智能設(shè)備的語音控制決策；以及向所述至少兩個智能設(shè)備發(fā)送對應(yīng)于其語音控制決策的控制指令。由此，通過控制使得處于至少兩個智能設(shè)備的拾音范圍內(nèi)的語音被唯一響應(yīng)，以解決多臺智能設(shè)備同時被喚醒帶來的用戶體驗問題。

技術(shù)領(lǐng)域

本公開涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域，特別涉及一種語音控制系統(tǒng)、方法和裝置以及計算設(shè)備和存儲介質(zhì)。

背景技術(shù)

隨著信息技術(shù)的飛速發(fā)展，越來越多的智能語音設(shè)備被投入使用，用戶通過簡單的語音喚醒即可喚醒相關(guān)智能語音設(shè)備，為用戶生活提供了更多便利。但是，當(dāng)用戶處于多臺智能語音設(shè)備拾音范圍內(nèi)時，這多臺智能語音設(shè)備均會采集到用戶的語音，并分別被喚醒而與用戶進行交互，導(dǎo)致多臺智能語音設(shè)備的應(yīng)答音頻重疊，影響用戶體驗。

因此，需要一種改進的語音控制策略，以解決上述問題。

發(fā)明內(nèi)容

本公開的目的是提供一種語音控制系統(tǒng)及語音控制方法和裝置，以解決多臺智能語音設(shè)備同時被喚醒帶來的用戶體驗問題。

根據(jù)本公開的第一個方面，提供了一種語音控制方法，該方法包括：獲取來自至少兩個智能設(shè)備的特征數(shù)據(jù)，所述特征數(shù)據(jù)用于確定所述智能設(shè)備與語音發(fā)出者之間的距離；基于所述特征數(shù)據(jù)，確定所述至少兩個智能設(shè)備各自與所述語音發(fā)出者之間的距離或能夠表征所述距離的參數(shù)；基于所述距離或參數(shù)確定對應(yīng)于所述至少兩個智能設(shè)備的語音控制決策；以及向所述至少兩個智能設(shè)備發(fā)送對應(yīng)于其語音控制決策的控制指令。

可選地，所述語音控制決策可以包括：使距離所述語音發(fā)出者最近的智能設(shè)備允許被喚醒；或者使除了距離所述語音發(fā)出者最近的智能設(shè)備以外的智能設(shè)備禁止被喚醒。

可選地，該方法還可以包括：以一個已接收到其發(fā)送的特征數(shù)據(jù)、并且尚未向其發(fā)送禁止被喚醒的控制指令的智能設(shè)備作為第一智能設(shè)備；獲取不同于所述第一智能設(shè)備的第二智能設(shè)備響應(yīng)于同一語音的特征數(shù)據(jù)；向所述第一智能設(shè)備和所述第二智能設(shè)備中距離所述語音發(fā)出者較遠的智能設(shè)備發(fā)送禁止被喚醒的控制指令，并以所述第一智能設(shè)備和所述第二智能設(shè)備中距離所述用戶較近的智能設(shè)備為新的第一智能設(shè)備。

可選地，在滿足預(yù)定條件的情況下，向第一智能設(shè)備發(fā)送喚醒控制指令。

可選地，該方法還包括：針對同一語音，在向第一智能設(shè)備發(fā)送喚醒控制指令之后，在獲取到來自其它智能設(shè)備的特征數(shù)據(jù)的情況下，向所述其它智能設(shè)備發(fā)送禁止被喚醒的控制指令。

可選地，所述預(yù)定條件包括如下的至少一項：針對同一語音，從接收到第一個智能設(shè)備發(fā)送的特征數(shù)據(jù)起達到預(yù)設(shè)的決策時間；針對同一語音，在預(yù)定時間段內(nèi)未接收到來自智能設(shè)備的特征數(shù)據(jù)。

可選地，所述方法由服務(wù)器和/或決策終端執(zhí)行，所述決策終端為多個智能設(shè)備中的一個智能設(shè)備，所述決策終端能夠與其它智能設(shè)備通信，所述服務(wù)器與所述多個智能設(shè)備之間基于無線通信網(wǎng)絡(luò)通信；并且/或者所述多個智能設(shè)備之間基于本地局域網(wǎng)通信。

可選地，所述服務(wù)器和/或所述決策終端獲取來自至少兩個智能設(shè)備的特征數(shù)據(jù)，并向所述至少兩個智能設(shè)備發(fā)送對應(yīng)于其語音控制決策的控制指令，所述智能設(shè)備執(zhí)行先接收到的所述控制指令。

可選地，該方法還可以包括：向所述多個智能設(shè)備發(fā)送設(shè)備信息表，所述設(shè)備信息表包括被指定為決策終端的智能設(shè)備的設(shè)備信息。

可選地，所述特征數(shù)據(jù)可以包括如下的至少一項：基于所述語音計算得到的喚醒能量值；所采集到的所述語音中的喚醒詞的置信度；采集所述語音時采集到的所述用戶的圖像；采集所述語音時探測到的用戶與智能設(shè)備的距離數(shù)據(jù)；以及所述智能設(shè)備的WiFi信道狀態(tài)信息。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司，未經(jīng)阿里巴巴集團控股有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910325459.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：基于鋁納米晶浮柵的柔性碳納米管光電記憶存儲器
下一篇：數(shù)據(jù)操作的控制方法及裝置

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】