[發(fā)明專利]一種基于后門攻擊的數(shù)據(jù)集保護和驗證方法在審
| 申請?zhí)枺?/td> | 202011279636.6 | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112364310A | 公開(公告)日: | 2021-02-12 |
| 發(fā)明(設(shè)計)人: | 潘曉光;王小華;焦璐璐;樊思佳;馬彩霞 | 申請(專利權(quán))人: | 山西三友和智慧信息技術(shù)股份有限公司 |
| 主分類號: | G06F21/16 | 分類號: | G06F21/16;G06T1/00;G06N3/08 |
| 代理公司: | 太原榮信德知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 14119 | 代理人: | 楊凱;連慧敏 |
| 地址: | 030000 山西省*** | 國省代碼: | 山西;14 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 后門 攻擊 數(shù)據(jù) 保護 驗證 方法 | ||
本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種基于后門攻擊的數(shù)據(jù)集保護和驗證方法,包括下列步驟:根據(jù)實際需求設(shè)置水印γ的比例;根據(jù)γ劃分原始數(shù)據(jù)集為良性樣本數(shù)據(jù)集Dbenign和攻擊樣本數(shù)據(jù)集Dattack;劃分后所得的攻擊樣本數(shù)據(jù)集Dattack添加水印,得到處理后的攻擊樣本數(shù)據(jù)集Dmodified;將處理后的攻擊樣本數(shù)據(jù)集Dmodified與良性樣本數(shù)據(jù)集Dbenign混合,得到水印數(shù)據(jù)集Dwatermarked。本發(fā)明使用在部分樣本上添加觸發(fā)器的方式設(shè)置攻擊樣本,這使得在水印數(shù)據(jù)集上用標準的訓(xùn)練過程訓(xùn)練模型時,能在保持對良性樣本的預(yù)測精度的同時指定隱藏的后門。本發(fā)明用于數(shù)據(jù)集的保護。
技術(shù)領(lǐng)域
本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種基于后門攻擊的數(shù)據(jù)集保護和驗證方法。
背景技術(shù)
近年來,深度神經(jīng)網(wǎng)絡(luò)在各個領(lǐng)域都取得了較為廣泛的應(yīng)用。其中數(shù)據(jù)集,特別是高質(zhì)量的開源數(shù)據(jù)集是深度神經(jīng)網(wǎng)絡(luò)繁榮的關(guān)鍵因素。這些開源數(shù)據(jù)集讓研究人員可以很容易地驗證他們的算法或模型的有效性,而這一過程反過來又加速了深度學(xué)習(xí)的發(fā)展。數(shù)據(jù)集的收集耗費了大量資源,其價值不言而喻,所以現(xiàn)有的開源數(shù)據(jù)集基本都要求它們只能用于學(xué)術(shù)或教育目的,而不能用于商業(yè)目的?;诖吮尘?,已經(jīng)有人提出了一些數(shù)據(jù)集保護技術(shù),如匿名化、加密和水印方法進行數(shù)據(jù)集保護,它們的目的是防止未經(jīng)授權(quán)的用戶訪問數(shù)據(jù)集。
然而,以上所提到的數(shù)據(jù)集保護方法卻并不適合保護開源數(shù)據(jù)集。因為許多開源數(shù)據(jù)集對每個人都是開放訪問的,唯一的要求是它們只能用于學(xué)術(shù)或教育目的。因此,保護開源數(shù)據(jù)集的主要問題是驗證它是否被用于訓(xùn)練第三方模型。
發(fā)明內(nèi)容
針對上述數(shù)據(jù)集保護方法不適合保護開源數(shù)據(jù)集的技術(shù)問題,本發(fā)明提供了一種效率高、可靠性強、實用性廣的基于后門攻擊的數(shù)據(jù)集保護方法。
為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
一種基于后門攻擊的數(shù)據(jù)集保護和驗證方法,包括下列步驟:
S1、根據(jù)實際需求設(shè)置水印γ的比例;
所述γ越小,則代表包含水印的數(shù)據(jù)所占比重越小,水印設(shè)置的越隱蔽,所述Dattack為攻擊樣本數(shù)據(jù)集,所述Dtrain為原始數(shù)據(jù)集;
S2、根據(jù)S1所得的γ劃分原始數(shù)據(jù)集為良性樣本數(shù)據(jù)集Dbenign和攻擊樣本數(shù)據(jù)集Dattack;
所述xi為輸入數(shù)據(jù),yi為輸出標簽,且xi∈{0,…,255}C×W×H,yi={1,…,K};
S3、為S2中劃分后所得的攻擊樣本數(shù)據(jù)集Dattack添加水印,得到處理后的攻擊樣本數(shù)據(jù)集Dmodified;
S4、將處理后的攻擊樣本數(shù)據(jù)集Dmodified與良性樣本數(shù)據(jù)集Dbenign混合,得到水印數(shù)據(jù)集Dwatermarked
所述Dwatermarked=Dbenign∪Dmodified。
所述S3中攻擊樣本數(shù)據(jù)集Dattack添加水印的方法為:
S3.1、設(shè)置yt={1,…,K}和t∈{0,…,255}C×W×H分別為目標標簽和指定的觸發(fā)器;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山西三友和智慧信息技術(shù)股份有限公司,未經(jīng)山西三友和智慧信息技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011279636.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種擺動剪切裝置
- 下一篇:一種低損耗分裂電抗型限流斷路器
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





