[發(fā)明專利]熱詞識(shí)別有效
| 申請(qǐng)?zhí)枺?/td> | 201610825577.5 | 申請(qǐng)日: | 2016-09-14 |
| 公開(公告)號(hào): | CN107016999B | 公開(公告)日: | 2022-06-14 |
| 發(fā)明(設(shè)計(jì))人: | 馬修·謝里菲;雅各布·尼古勞斯·弗爾斯特 | 申請(qǐng)(專利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類號(hào): | G10L17/08 | 分類號(hào): | G10L17/08;G10L17/22;G10L15/22;G06F16/33 |
| 代理公司: | 中原信達(dá)知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 周亞榮;安翔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 識(shí)別 | ||
本發(fā)明涉及熱詞識(shí)別。方法、系統(tǒng)以及裝置,包括編碼在計(jì)算機(jī)存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序,用于接收對(duì)應(yīng)于話語的音頻數(shù)據(jù),確定所述音頻數(shù)據(jù)對(duì)應(yīng)于熱詞,生成被確定為對(duì)應(yīng)于所述熱詞的所述音頻數(shù)據(jù)的熱詞音頻指紋,將所述熱詞音頻指紋與先前被確定為對(duì)應(yīng)于所述熱詞的音頻數(shù)據(jù)的一個(gè)或多個(gè)所存儲(chǔ)的音頻指紋相比較,基于所述比較是否指示所述熱詞音頻指紋與先前被確定為對(duì)應(yīng)于所述熱詞的音頻數(shù)據(jù)的一個(gè)或多個(gè)所存儲(chǔ)的音頻指紋中的一個(gè)之間的相似度滿足預(yù)先確定的閾值,檢測(cè)所述熱詞音頻指紋是否匹配所存儲(chǔ)的音頻指紋,以及響應(yīng)于檢測(cè)到所述熱詞音頻指紋匹配所存儲(chǔ)的音頻指紋,禁止對(duì)向其說出了所述話語的計(jì)算設(shè)備的訪問。
本申請(qǐng)要求于2015年10月16日提交的美國臨時(shí)專利申請(qǐng)?zhí)?2/242,650的權(quán)益,其內(nèi)容通過引用并入于此。
技術(shù)領(lǐng)域
本說明書一般地涉及語音識(shí)別。
背景技術(shù)
自動(dòng)語音識(shí)別是計(jì)算設(shè)備中使用的重要技術(shù)。電子設(shè)備的語音識(shí)別服務(wù)通常接收包括來自用戶的說出詞的發(fā)音話語,并且將該說出詞轉(zhuǎn)錄為文本。發(fā)音話語可以包括熱詞,即預(yù)先確定的保留詞,其使得系統(tǒng)或設(shè)備執(zhí)行對(duì)應(yīng)的動(dòng)作。
發(fā)明內(nèi)容
本公開的實(shí)施方式涉及熱詞識(shí)別,例如使用熱詞來經(jīng)由話音解鎖或啟用對(duì)移動(dòng)設(shè)備的訪問,并且抑制重放攻擊。重放攻擊是一種過程,未經(jīng)授權(quán)的用戶通過該過程捕捉由設(shè)備的所有者或授權(quán)的用戶說出的熱詞的音頻并且將其重放以便獲得對(duì)該設(shè)備的某種等級(jí)的未經(jīng)授權(quán)的訪問。根據(jù)本公開的實(shí)施方式,可以通過驗(yàn)證每個(gè)話語的獨(dú)特性來抑制熱詞或任何基于語音的重放攻擊。特別地,可以記錄并存儲(chǔ)針對(duì)特定設(shè)備或者針對(duì)特定用戶而識(shí)別的最近、最后N個(gè)或所有熱詞話語??梢陨梢纛l指紋并且將其針對(duì)每個(gè)熱詞話語存儲(chǔ),并且可以在從新的話語生成的音頻指紋之間執(zhí)行與每個(gè)先前記錄的音頻指紋的比較以檢查先前是否已經(jīng)使用指示重放的相同的話語音頻。此外,在某些實(shí)施方式中,其它信號(hào),例如超聲波音頻注入和跨話語驗(yàn)證,可被用于進(jìn)一步限制重放攻擊的有效性。
在本說明書中所述的主題的一個(gè)創(chuàng)造性方面體現(xiàn)在包括以下動(dòng)作的方法中:接收對(duì)應(yīng)于話語的音頻數(shù)據(jù);確定所述音頻數(shù)據(jù)對(duì)應(yīng)于熱詞;生成被確定為對(duì)應(yīng)于所述熱詞的所述音頻數(shù)據(jù)的熱詞音頻指紋;確定所述熱詞音頻指紋與先前被確定為對(duì)應(yīng)于所述熱詞的音頻數(shù)據(jù)的一個(gè)或多個(gè)所存儲(chǔ)的音頻指紋之間的相似度;基于所述熱詞音頻指紋與所述一個(gè)或多個(gè)所存儲(chǔ)的音頻指紋中的一個(gè)之間的所述相似度是否滿足預(yù)先確定的閾值,檢測(cè)所述熱詞音頻指紋是否與先前被確定為對(duì)應(yīng)于所述熱詞的音頻數(shù)據(jù)的所存儲(chǔ)的音頻指紋相匹配;以及響應(yīng)于檢測(cè)到所述熱詞音頻指紋與所存儲(chǔ)的音頻指紋相匹配,禁止對(duì)向其說出了所述話語的計(jì)算設(shè)備的訪問。
通常,在本說明書中所述的主題的另一方面體現(xiàn)在包括以下動(dòng)作的方法中:接收對(duì)應(yīng)于附加話語的附加音頻數(shù)據(jù);使用所述附加音頻數(shù)據(jù)辨識(shí)說話者辨識(shí)d-向量;確定來自所述附加音頻數(shù)據(jù)的所述說話者辨識(shí)d-向量與來自對(duì)應(yīng)于所述話語的所述音頻數(shù)據(jù)的熱詞d-向量之間的相似度;基于來自對(duì)應(yīng)于所述話語的所述音頻數(shù)據(jù)的所述熱詞d-向量與來自所述附加音頻數(shù)據(jù)的所述說話者辨識(shí)d-向量之間的所述相似度是否滿足特定閾值,檢測(cè)對(duì)應(yīng)于所述熱詞的所述音頻數(shù)據(jù)是否匹配所述附加音頻數(shù)據(jù);以及響應(yīng)于檢測(cè)到對(duì)應(yīng)于所述熱詞的所述音頻數(shù)據(jù)不匹配所述附加音頻數(shù)據(jù),禁止對(duì)所述計(jì)算設(shè)備的訪問。
根據(jù)在本說明書中所述的主題的另一方面,所述熱詞可以是特定詞項(xiàng),所述特定詞項(xiàng)觸發(fā)對(duì)跟在所述特定詞項(xiàng)之后的一個(gè)或多個(gè)詞項(xiàng)中的附加詞項(xiàng)的語義解釋。跟在所述特定詞項(xiàng)之后的一個(gè)或多個(gè)詞項(xiàng)中的附加詞項(xiàng)可以與查詢或命令相關(guān)聯(lián)。
在本說明書中所述的主題的另一方面可以體現(xiàn)在包括以下動(dòng)作的方法中:接收對(duì)應(yīng)于話音命令或查詢的附加音頻數(shù)據(jù),以及確定所述話音命令或查詢的類型。此外,所述預(yù)先確定的閾值可以基于所述話音命令或查詢的所確定的類型來調(diào)整。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610825577.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





