[發(fā)明專利]揚(yáng)聲器識別和不受支持的揚(yáng)聲器適配技術(shù)有效
| 申請?zhí)枺?/td> | 201580046288.9 | 申請日: | 2015-08-27 |
| 公開(公告)號: | CN106796791B | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計)人: | Y·金;S·S·卡加克卡 | 申請(專利權(quán))人: | 蘋果公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L17/04;G10L17/06 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 王茂華;張寧 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 揚(yáng)聲器 識別 不受 支持 技術(shù) | ||
本申請?zhí)峁┝擞糜谏捎糜趫?zhí)行針對虛擬助理的揚(yáng)聲器識別的揚(yáng)聲器配置文件的系統(tǒng)和過程。一種示例性過程可包括接收包括用戶語音的音頻輸入以及基于針對預(yù)先確定的用戶的揚(yáng)聲器配置文件確定用戶語音的揚(yáng)聲器是否為預(yù)先確定的用戶。響應(yīng)于確定用戶語音的揚(yáng)聲器為預(yù)先確定的用戶,可將用戶語音添加到揚(yáng)聲器配置文件并且可觸發(fā)虛擬助理的操作。響應(yīng)于確定用戶語音的揚(yáng)聲器不是預(yù)先確定的用戶,可將用戶語音添加到另選的揚(yáng)聲器配置文件并且可不觸發(fā)虛擬助理的操作。在一些示例中,可使用上下文信息來驗證揚(yáng)聲器識別過程產(chǎn)生的結(jié)果。
相關(guān)申請的交叉引用
本申請要求2014年9月30日提交的題為“SPEAKER IDENTIFICATION ANDUNSUPERVISED SPEAKER ADAPTATION TECHNIQUES”的美國臨時申請No.62/057,990和2015年8月25日提交的題為“SPEAKER IDENTIFICATION AND UNSUPERVISED SPEAKERADAPTATION TECHNIQUES”的美國非臨時申請No.14/835,169的優(yōu)先權(quán),其全文出于所有目的以引用方式并入本文。
技術(shù)領(lǐng)域
本申請通常涉及自然語言處理,尤其涉及執(zhí)行針對自然語言處理的揚(yáng)聲器識別。
背景技術(shù)
智能自動助理(或虛擬助理)在用戶和電子設(shè)備之間提供直觀的界面。這些助理可允許用戶使用語言和/或文本形式的自然語言與設(shè)備或系統(tǒng)交互。例如,用戶可通過將自然語言形式的語音用戶輸入提供給與電子設(shè)備相關(guān)聯(lián)的虛擬助理來訪問電子設(shè)備的服務(wù)。虛擬助理可對語音用戶輸入執(zhí)行自然語言處理以推斷用戶意圖并將用戶意圖操作為任務(wù)。隨后可通過執(zhí)行電子設(shè)備的一個或多個功能執(zhí)行任務(wù),并且可將相關(guān)輸出以自然語言形式返回到用戶。
一些自然語言處理系統(tǒng)可執(zhí)行揚(yáng)聲器識別來驗證用戶的身份。這些系統(tǒng)典型地需要用戶執(zhí)行注冊過程,在注冊過程期間用戶說出一系列預(yù)先確定的字詞或短語來允許自然語言處理系統(tǒng)對用戶語音建模。盡管此過程可用來有效地對用戶語音建模,但是如果用戶在注冊過程期間以非自然方式說出和/或如果用戶在不同于稍后執(zhí)行揚(yáng)聲器識別的聲學(xué)環(huán)境下執(zhí)行注冊過程,則該過程可能會產(chǎn)生不可靠的結(jié)果。因此,希望用于對用戶語音建模的改進(jìn)過程。
發(fā)明內(nèi)容
本申請?zhí)峁┝擞糜谏捎糜趫?zhí)行針對虛擬助理的揚(yáng)聲器識別的揚(yáng)聲器配置文件的系統(tǒng)和過程。一種示例性過程可包括接收包括用戶語音的音頻輸入以及基于針對預(yù)先確定的用戶的揚(yáng)聲器配置文件確定用戶語音的揚(yáng)聲器是否為預(yù)先確定的用戶。響應(yīng)于確定用戶語音的揚(yáng)聲器為預(yù)先確定的用戶,可將用戶語音添加到揚(yáng)聲器配置文件并且可觸發(fā)虛擬助理的操作。響應(yīng)于確定用戶語音的揚(yáng)聲器不是預(yù)先確定的用戶,可將用戶語音添加到另選的揚(yáng)聲器配置文件并且可不觸發(fā)虛擬助理的操作。在一些示例中,可使用上下文信息來驗證揚(yáng)聲器識別過程產(chǎn)生的結(jié)果。
附圖說明
圖1示出了根據(jù)各種示例的虛擬助理可操作的示例性環(huán)境。
圖2示出了根據(jù)各種示例的示例性用戶設(shè)備。
圖3示出了根據(jù)各種示例的用于操作虛擬助理的示例性過程。
圖4示出了根據(jù)各種示例的用于在揚(yáng)聲器配置文件生成模式操作虛擬助理的示例性過程。
圖5示出了根據(jù)各種示例的用于在揚(yáng)聲器配置文件修改模式操作虛擬助理的示例性過程。
圖6示出了根據(jù)各種示例的用于在靜態(tài)揚(yáng)聲器配置文件模式操作虛擬助理的示例性過程。
圖7示出了根據(jù)各種示例的用于執(zhí)行揚(yáng)聲器識別的示例性過程。
圖8示出了根據(jù)各種示例的配置為基于語音用戶輸入生成揚(yáng)聲器配置文件的電子設(shè)備的功能框圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘋果公司,未經(jīng)蘋果公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580046288.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





