[發(fā)明專利]使用多個計(jì)算設(shè)備的對講式通信在審
| 申請?zhí)枺?/td> | 201880038644.6 | 申請日: | 2018-09-11 |
| 公開(公告)號: | CN110741433A | 公開(公告)日: | 2020-01-31 |
| 發(fā)明(設(shè)計(jì))人: | 桑德羅·弗茲;塞巴斯蒂安·米柳斯;揚(yáng)·奧爾索斯 | 申請(專利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;H04L29/08;H04W4/12;G06F40/20;G06F3/16;G06N3/08;G06N7/00;G10L15/26 |
| 代理公司: | 11219 中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人: | 周亞榮;鄧聰惠 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計(jì)算設(shè)備 視覺輸出 消息傳達(dá) 語音 通信相關(guān) 用戶接收 麥克風(fēng) 對講 感知 分析 改進(jìn) | ||
描述了與使用關(guān)于環(huán)境分布的多個計(jì)算設(shè)備的改進(jìn)的對講式通信相關(guān)的技術(shù)。在各種實(shí)施方式中,可以例如在多個計(jì)算設(shè)備的第一計(jì)算設(shè)備的麥克風(fēng)處從第一用戶接收語音輸入。可以分析語音輸入,并且基于該分析,可以確定第一用戶旨在將消息傳達(dá)給第二用戶。可以確定第二用戶相對于多個計(jì)算設(shè)備的位置,從而基于第二用戶的位置,可以從多個計(jì)算設(shè)備中選擇能夠提供第二用戶可感知的音頻或視覺輸出的第二計(jì)算設(shè)備。然后,第二計(jì)算設(shè)備可以被操作以提供將消息傳達(dá)給第二用戶的音頻或視覺輸出。
背景技術(shù)
人們可以使用在本文中稱為“自動化助理”(也稱為“聊天機(jī)器人”、“交互式個人助理”、“智能個人助理”、“個人語音助理”、“會話代理”等)的交互式軟件應(yīng)用加入人機(jī)對話。例如,人們(當(dāng)他們與自動化助理互動時,可以被稱為“用戶”)可以使用在一些情況下可以被轉(zhuǎn)換為文本然后進(jìn)行處理的語音自然語言輸入(即話語)和/或通過提供文本(例如,鍵入的)自然語言輸入來提供命令、查詢和/或請求。
在一些情況下,自動化助理可以包括本地安裝在客戶端設(shè)備上并由用戶直接加入的自動化助理“客戶端”,以及利用云的虛擬的無限資源來幫助自動化助理客戶端響應(yīng)用戶的查詢的基于云的對方。例如,自動化助理客戶端可以向基于云的對方提供用戶查詢的音頻記錄(或其文本轉(zhuǎn)換)以及指示用戶身份的數(shù)據(jù)(例如證書)。基于云的對方可以對查詢執(zhí)行各種處理,以將各種結(jié)果返回給自動化助理客戶端,然后該自動化助理客戶端可以向用戶提供相應(yīng)的輸出。為簡潔和簡化起見,術(shù)語“自動化助理”在本文中描述為“服務(wù)”特定用戶時,可以指安裝在特定用戶的客戶端設(shè)備上的自動化助理客戶端,以及與自動化助理客戶端交互以響應(yīng)用戶的查詢的任何基于云的對方。
許多用戶可以使用多個設(shè)備來使自動化助理加入。例如,某些用戶可能擁有計(jì)算設(shè)備的協(xié)調(diào)“生態(tài)系統(tǒng)”,其包括一個或多個智能電話、一個或多個平板電腦、一個或多個車輛計(jì)算系統(tǒng)、一個或多個可穿戴計(jì)算設(shè)備、一個或多個智能電視和/或一個或多個獨(dú)立的交互式揚(yáng)聲器,以及其他更傳統(tǒng)的計(jì)算設(shè)備。用戶可以使用這些設(shè)備中的任何加入與自動化助理的人機(jī)對話(假設(shè)已安裝自動化助理客戶端)。在一些情況下,這些設(shè)備可能散布在用戶的家中或工作場所中。例如,諸如智能電話、平板電腦、智能手表等的移動計(jì)算設(shè)備可以在用戶的身上和/或用戶最后將它們放置的任何地方(例如,在充電站處)。諸如傳統(tǒng)的臺式計(jì)算機(jī)、智能電視和獨(dú)立的交互式揚(yáng)聲器的其他計(jì)算設(shè)備可能會更固定,但仍然可以位于用戶家或工作場所內(nèi)的各個位置(例如,房間)處。
存在使多個用戶(例如,家庭、同事、同居者等)能夠利用多個計(jì)算設(shè)備的分布式性質(zhì)來促進(jìn)多個用戶之間的對講式語音通信的技術(shù)。然而,這些技術(shù)限于用戶發(fā)出明確的命令以將消息傳達(dá)到明確限定的計(jì)算設(shè)備。例如,希望將消息傳達(dá)到能夠聽到的距離之外的另一位置(例如,在另一房間中)的第二用戶的第一用戶必須首先確定第二用戶的位置。只有這樣,第一用戶才能明確調(diào)用到在第二用戶的位置處或附近的計(jì)算設(shè)備的對講通信信道,以便第一用戶可以將消息傳達(dá)給第二用戶位置處的第二用戶。如果第一用戶不知道第二用戶的位置,則第一用戶可能被迫使簡單地使得消息在可用于對講式通信的所有計(jì)算設(shè)備上廣播。此外,如果第一用戶不知道第二用戶不在能夠聽到的距離內(nèi)(例如,第一用戶正在做飯并且沒有注意到第二用戶離開廚房),則第一用戶可能沒有意識到對講式通信是必要的,并且可能會在空房間說出該消息。
發(fā)明內(nèi)容
本文描述了用于使用圍繞諸如房屋、公寓、營業(yè)場所等的環(huán)境分布的多個計(jì)算設(shè)備的改進(jìn)的對講式通信的技術(shù)。例如,本文描述了用于使得能夠確定環(huán)境中內(nèi)的多個用戶的位置,使得(i)可以自動地確定語音消息的預(yù)期接收者是否在能聽到說話者的范圍內(nèi),以及(ii)可以識別預(yù)期接收者附近的合適的計(jì)算設(shè)備,并且將其用于輸出消息,以便預(yù)期接收者接收它的技術(shù)。另外,本文描述了用于自動地確定用戶話語是否構(gòu)成以下內(nèi)容的技術(shù):(a)調(diào)用自動化助理以正常使用的命令;(b)將語音消息傳達(dá)給可能潛在地要求本文所述的對講式通信的另一用戶的嘗試;和/或(c)不要求動作的其他背景噪音/對話。另外,本文描述了用于允許使用所公開的技術(shù)接收到的對講式消息的接收者發(fā)出至少部分地基于說話者傳達(dá)的原始消息來(例如,使用自然語言處理)處理的請求(例如,對自動化助理搜索查詢或其他命令,諸如訂購比薩、播放歌曲等)的技術(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880038644.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





