[發(fā)明專利]一種基于房間脈沖響應(yīng)的語音后門驗(yàn)證方法和裝置在審

申請(qǐng)?zhí)枺?/td>	202310533603.7	申請(qǐng)日：	2023-05-12
公開（公告）號(hào)：	CN116597811A	公開（公告）日：	2023-08-15
發(fā)明（設(shè)計(jì)）人：	盧立;陳錳;巴鐘杰;林峰;任奎	申請(qǐng)（專利權(quán)）人：	浙江大學(xué);浙江大學(xué)杭州國(guó)際科創(chuàng)中心
主分類號(hào)：	G10L15/01	分類號(hào)：	G10L15/01;G10L15/06;G10L15/16;G10L17/04;G10L17/18;G06F21/57;G06N3/0455;G06N3/0464;G06N3/0475;G06N3/094
代理公司：	杭州天勤知識(shí)產(chǎn)權(quán)代理有限公司 33224	代理人：	曹兆霞
地址：	310058 浙江***	國(guó)省代碼：	浙江;33
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于房間脈沖響應(yīng) 語音后門驗(yàn)證方法裝置
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種基于房間脈沖響應(yīng)的語音后門驗(yàn)證方法，包括：獲取目標(biāo)語音模型的干凈語音樣本和其所在物理空間的屬性信息；根據(jù)屬性信息設(shè)定聲學(xué)參數(shù)，并根據(jù)聲學(xué)參數(shù)構(gòu)建房間脈沖響應(yīng)的條件向量；將條件向量與隨機(jī)采樣的隱向量拼接后輸入房間脈沖響應(yīng)生成器，合成房間脈沖響應(yīng)信號(hào)作為動(dòng)態(tài)觸發(fā)器；使用動(dòng)態(tài)觸發(fā)器對(duì)干凈語音樣本進(jìn)行投毒作為毒化語音樣本，利用毒化語音樣本和干凈語音樣本對(duì)目標(biāo)語音模型進(jìn)行訓(xùn)練，使得目標(biāo)語音模型被受到感染并被注入后門；將受感染的目標(biāo)語音模型部署后，正常說話發(fā)出語音以觸發(fā)后門，從而驗(yàn)證目標(biāo)語音模型的后門脆弱性，該方法有效提升語音后門的隱蔽性和魯棒性，從而提供真實(shí)可靠的后門攻擊測(cè)試。

技術(shù)領(lǐng)域

本發(fā)明屬于計(jì)算機(jī)人工智能安全領(lǐng)域，具體涉及一種基于房間脈沖響應(yīng)的語音后門驗(yàn)證方法和裝置。

背景技術(shù)

近年來，深度學(xué)習(xí)技術(shù)為現(xiàn)代語音系統(tǒng)(如語音內(nèi)容識(shí)別和身份辨認(rèn))賦予了強(qiáng)大的認(rèn)知能力。然而，最新的研究揭示了現(xiàn)代語音系統(tǒng)對(duì)訓(xùn)練數(shù)據(jù)的高度依賴會(huì)導(dǎo)致嚴(yán)重的后門安全威脅。這類后門攻擊依賴精心設(shè)計(jì)的觸發(fā)器，僅需污染少量訓(xùn)練數(shù)據(jù)即可建立與目標(biāo)輸出強(qiáng)烈的虛假關(guān)聯(lián)，從而誤導(dǎo)系統(tǒng)輸出錯(cuò)誤的結(jié)果。該攻擊并不影響系統(tǒng)的正常使用，因此具有較強(qiáng)的隱蔽性，嚴(yán)重威脅著人工智能系統(tǒng)安全。

為評(píng)估和改善語音系統(tǒng)的安全性和魯棒性，需要進(jìn)行前置性的后門脆弱性測(cè)試。然而，現(xiàn)有的后門攻擊測(cè)試研究?jī)H在數(shù)字空間驗(yàn)證了語音后門學(xué)習(xí)的可行性，即通過在時(shí)域和頻域設(shè)計(jì)不同的觸發(fā)器(如單頻音、超聲波、背景音以及對(duì)抗樣本等)來向語音命令識(shí)別或語音身份識(shí)別系統(tǒng)植入后門。這些研究假設(shè)觸發(fā)器經(jīng)過網(wǎng)絡(luò)傳輸后直接注入到目標(biāo)語音系統(tǒng)中而沒有任何失真，極大偏離了真實(shí)的攻擊測(cè)試環(huán)境。此外，現(xiàn)有的數(shù)字域觸發(fā)器隱蔽性差且不能抵抗信道干擾，導(dǎo)致后門攻擊測(cè)試能力不足。

因此，如何提升物理空間中語音后門的隱蔽性和魯棒性，從而提供真實(shí)可靠的攻擊測(cè)試方案是當(dāng)前需要解決的問題。

公開號(hào)為CN114462031A的專利申請(qǐng)公開了一種后門攻擊方法，包括獲取目標(biāo)模型的原始樣本數(shù)據(jù)；從原始樣本數(shù)據(jù)中選取類別標(biāo)簽為目標(biāo)類別的目標(biāo)樣本數(shù)據(jù)作為投毒數(shù)據(jù)，并對(duì)目標(biāo)樣本數(shù)據(jù)中的原始文本設(shè)置觸發(fā)器，獲得投毒數(shù)據(jù)；將原始樣本數(shù)據(jù)與投毒數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)對(duì)目標(biāo)模型進(jìn)行訓(xùn)練，獲得測(cè)試模型；其中，測(cè)試模型用于對(duì)設(shè)置有觸發(fā)器的測(cè)試數(shù)據(jù)進(jìn)行攻擊測(cè)試。

公開號(hào)為CN113946687A的專利文獻(xiàn)公開了一種標(biāo)簽一致的文本后門攻擊方法，包括：針對(duì)目標(biāo)數(shù)據(jù)集，通過義原庫生成觸發(fā)詞；利用對(duì)抗擾動(dòng)的方法和基于黑盒條件的隱藏關(guān)鍵字方法擾動(dòng)原始輸入樣本；通過基于義原的觸發(fā)詞替換方法，將生成的觸發(fā)詞添加到擾動(dòng)后的句子中生成中毒樣本，并用中毒數(shù)據(jù)集訓(xùn)練目標(biāo)模型；推理階段通過義原替換的方法將觸發(fā)詞添加到測(cè)試句子上，從而誘騙目標(biāo)模型預(yù)測(cè)目標(biāo)類別。本發(fā)明設(shè)

將以上兩個(gè)專利文獻(xiàn)記載的技術(shù)方案應(yīng)用到語音識(shí)別系統(tǒng)時(shí)，由于觸發(fā)器沒有任何失真，極大偏離了真實(shí)的攻擊測(cè)試環(huán)境，導(dǎo)致后門攻擊測(cè)試能力不足。

發(fā)明內(nèi)容

鑒于上述，本發(fā)明的目的是提供一種基于房間脈沖響應(yīng)的語音后門驗(yàn)證方法和裝置，實(shí)現(xiàn)了物理空間中語音后門的植入與激活，有效提升語音后門的隱蔽性和魯棒性，從而提供真實(shí)可靠的后門攻擊測(cè)試。

為實(shí)現(xiàn)上述發(fā)明目的，實(shí)施例提供的一種基于房間脈沖響應(yīng)的語音后門驗(yàn)證方法，包括以下步驟：

獲取目標(biāo)語音模型的干凈語音樣本，同時(shí)獲得目標(biāo)語音模型所在物理空間的屬性信息；

根據(jù)屬性信息設(shè)定聲學(xué)參數(shù)；

根據(jù)聲學(xué)參數(shù)構(gòu)建房間脈沖響應(yīng)的條件向量；

將條件向量與隨機(jī)采樣的隱向量拼接后輸入預(yù)訓(xùn)練的房間脈沖響應(yīng)生成器，合成一批房間脈沖響應(yīng)信號(hào)作為動(dòng)態(tài)觸發(fā)器；

使用動(dòng)態(tài)觸發(fā)器對(duì)干凈語音樣本進(jìn)行投毒作為毒化語音樣本，利用毒化語音樣本和干凈語音樣本對(duì)目標(biāo)語音模型進(jìn)行增強(qiáng)訓(xùn)練，使得目標(biāo)語音模型受到感染并被注入后門；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué);浙江大學(xué)杭州國(guó)際科創(chuàng)中心，未經(jīng)浙江大學(xué);浙江大學(xué)杭州國(guó)際科創(chuàng)中心許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202310533603.7/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識(shí)別；音頻分析或處理
G10L15-00 語音識(shí)別
G10L15-02 .語音識(shí)別的特征提取；識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識(shí)別系統(tǒng)，例如對(duì)說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】