[發明專利]對抗樣本生成方法、裝置、電子設備及存儲介質在審
| 申請號: | 202211085668.1 | 申請日: | 2022-09-06 |
| 公開(公告)號: | CN115688915A | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 張華;李文敏;涂騰飛;王小萌;楊興國;高浩然;王稼慧 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06N3/094 | 分類號: | G06N3/094;G06F16/35;G06F40/30;G06F40/289;G06N3/04 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 王剛 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對抗 樣本 生成 方法 裝置 電子設備 存儲 介質 | ||
本申請提供的一種對抗樣本生成方法、裝置、電子設備及存儲介質,包括:獲取樣本數據,將樣本數據作為初始數據,基于語義分類器計算初始數據中的每個單詞的重要性得分,基于重要性得分對單詞進行排序;利用基于轉換器的雙向編碼表征算法計算每個單詞的同義詞集合及每個同義詞的語義得分;基于排序順序選取一個單詞為待替換單詞,基于待替換單詞的同義詞集合及每個同義詞的語義得分,計算待替換單詞的每個同義詞的攻擊性得分;選取攻擊性得分最高的同義詞,在初始數據中替換待替換單詞,生成待測試數據;判斷待測試數據能否完成對樣本數據的攻擊行為,若是,則將待測試數據作為樣本數據的對抗樣本。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種對抗樣本生成方法、裝置、電子設備及存儲介質。
背景技術
與圖像中修改像素值不同,文本屬于離散數據,對文本的擾動易被檢測,并且難以保持語義的不變形。以中文為例,中文是由大量的具有獨立含義的漢字組成,其中每一個句子的意義直接取決于組成該句子的漢字的意義以及這些漢字在句法上相互關聯的方式,因此簡單的修改單個漢字可能會極大地改變句子的原始語義,因而導致中文對抗攻擊的難度較大。
但是,隨著技術的進步,為了應對可能的風險,進一步提升神經網絡的安全性,在對現有神經網絡進行對抗樣本防御訓練時,越來越需求語義性更高的對抗樣本進行訓練,進而如何生成語義性較好的對抗樣本的問題,便成為亟待解決的技術問題。
發明內容
有鑒于此,本申請提出一種對抗樣本生成方法、裝置、電子設備及存儲介質,以此方案生成語義性較好的對抗樣本,以此加強當前神經網絡的安全性訓練,提升文本識別、文本檢測的安全性。
基于上述目的,本申請提供了一種對抗樣本生成方法,包括:
獲取樣本數據,將所述樣本數據作為初始數據,基于語義分類器計算所述初始數據中的每個單詞的重要性得分,基于所述重要性得分對所述單詞進行排序;
利用基于轉換器的雙向編碼表征算法計算每個所述單詞的同義詞集合及每個同義詞的語義得分;
基于排序順序選取一個所述單詞為待替換單詞,基于所述待替換單詞的所述同義詞集合及所述每個同義詞的語義得分,計算所述待替換單詞的每個同義詞的攻擊性得分;
選取所述攻擊性得分最高的同義詞,在所述初始數據中替換所述待替換單詞,生成待測試數據;
判斷所述待測試數據能否完成對所述樣本數據的攻擊行為,若是,則將所述待測試數據作為所述樣本數據的對抗樣本。
在一些實施方式中,所述判斷所述待測試數據能否完成對所述樣本數據的攻擊行為,還包括:
若否,基于排序順序選取當前待替換單詞的下一個所述單詞替換所述待替換單詞,將所述待測試數據替換所述初始數據;
重新生成所述待測試數據,基于新生成的所述待測試數據,再次判斷所述待測試數據能否完成對所述樣本數據的攻擊行為。
在一些實施方式中,所述判斷所述待測試數據能否完成對所述樣本數據的攻擊行為,還包括:
統計重新生成所述待測試數據的次數,若所述次數大于預設閾值,則認為所述待測試數據完成對所述樣本數據的攻擊行為。
在一些實施方式中,所述基于語義分類器計算所述初始數據中的每個單詞的重要性得分,具體為:
Cwi=F(w1,...,wi-1,wi,Wi+1,...,wN)-F(w1,....,wi-1,wi+1,...,wN)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211085668.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:粉末壓團裝置
- 下一篇:一種防撞護舷及其使用方法





