[發明專利]對抗樣本生成方法、裝置、電子設備及存儲介質在審

申請號：	202211085668.1	申請日：	2022-09-06
公開（公告）號：	CN115688915A	公開（公告）日：	2023-02-03
發明（設計）人：	張華;李文敏;涂騰飛;王小萌;楊興國;高浩然;王稼慧	申請（專利權）人：	北京郵電大學
主分類號：	G06N3/094	分類號：	G06N3/094;G06F16/35;G06F40/30;G06F40/289;G06N3/04
代理公司：	北京風雅頌專利代理有限公司 11403	代理人：	王剛
地址：	100876 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	對抗樣本生成方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請提供的一種對抗樣本生成方法、裝置、電子設備及存儲介質，包括：獲取樣本數據，將樣本數據作為初始數據，基于語義分類器計算初始數據中的每個單詞的重要性得分，基于重要性得分對單詞進行排序；利用基于轉換器的雙向編碼表征算法計算每個單詞的同義詞集合及每個同義詞的語義得分；基于排序順序選取一個單詞為待替換單詞，基于待替換單詞的同義詞集合及每個同義詞的語義得分，計算待替換單詞的每個同義詞的攻擊性得分；選取攻擊性得分最高的同義詞，在初始數據中替換待替換單詞，生成待測試數據；判斷待測試數據能否完成對樣本數據的攻擊行為，若是，則將待測試數據作為樣本數據的對抗樣本。

技術領域

本申請涉及人工智能技術領域，尤其涉及一種對抗樣本生成方法、裝置、電子設備及存儲介質。

背景技術

與圖像中修改像素值不同，文本屬于離散數據，對文本的擾動易被檢測，并且難以保持語義的不變形。以中文為例，中文是由大量的具有獨立含義的漢字組成，其中每一個句子的意義直接取決于組成該句子的漢字的意義以及這些漢字在句法上相互關聯的方式，因此簡單的修改單個漢字可能會極大地改變句子的原始語義，因而導致中文對抗攻擊的難度較大。

但是，隨著技術的進步，為了應對可能的風險，進一步提升神經網絡的安全性，在對現有神經網絡進行對抗樣本防御訓練時，越來越需求語義性更高的對抗樣本進行訓練，進而如何生成語義性較好的對抗樣本的問題，便成為亟待解決的技術問題。

發明內容

有鑒于此，本申請提出一種對抗樣本生成方法、裝置、電子設備及存儲介質，以此方案生成語義性較好的對抗樣本，以此加強當前神經網絡的安全性訓練，提升文本識別、文本檢測的安全性。

基于上述目的，本申請提供了一種對抗樣本生成方法，包括：

獲取樣本數據，將所述樣本數據作為初始數據，基于語義分類器計算所述初始數據中的每個單詞的重要性得分，基于所述重要性得分對所述單詞進行排序；

利用基于轉換器的雙向編碼表征算法計算每個所述單詞的同義詞集合及每個同義詞的語義得分；

基于排序順序選取一個所述單詞為待替換單詞，基于所述待替換單詞的所述同義詞集合及所述每個同義詞的語義得分，計算所述待替換單詞的每個同義詞的攻擊性得分；

選取所述攻擊性得分最高的同義詞，在所述初始數據中替換所述待替換單詞，生成待測試數據；

判斷所述待測試數據能否完成對所述樣本數據的攻擊行為，若是，則將所述待測試數據作為所述樣本數據的對抗樣本。

在一些實施方式中，所述判斷所述待測試數據能否完成對所述樣本數據的攻擊行為，還包括：

若否，基于排序順序選取當前待替換單詞的下一個所述單詞替換所述待替換單詞，將所述待測試數據替換所述初始數據；

重新生成所述待測試數據，基于新生成的所述待測試數據，再次判斷所述待測試數據能否完成對所述樣本數據的攻擊行為。