[發(fā)明專利]一種對(duì)抗樣本的生成方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010213381.7 | 申請(qǐng)日: | 2020-03-24 |
| 公開(公告)號(hào): | CN113449097A | 公開(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 呂中厚;王文華;劉焱 | 申請(qǐng)(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F40/151;G06F40/216;G06F11/14;G06N20/00;G06N3/00 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 對(duì)抗 樣本 生成 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種對(duì)抗樣本的生成方法,其特征在于,包括:
基于文本分類模型的原始文本樣本,生成多個(gè)粒子文本樣本,其中所述多個(gè)粒子文本樣本與所述原始文本樣本不同;
確定當(dāng)前多個(gè)粒子文本樣本中是否存在針對(duì)所述文本分類模型的有效對(duì)抗樣本,若存在,則將所述有效對(duì)抗樣本進(jìn)行輸出;
若不存在,則將當(dāng)前多個(gè)粒子文本樣本進(jìn)行更新,將更新后的多個(gè)粒子文本樣本作為當(dāng)前多個(gè)粒子文本樣本,并返回執(zhí)行確定當(dāng)前多個(gè)粒子文本樣本中是否存在針對(duì)所述文本分類模型的有效對(duì)抗樣本的步驟。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于文本分類模型的原始文本樣本,生成多個(gè)粒子文本樣本,包括:
生成文本分類模型的原始文本樣本對(duì)應(yīng)的多個(gè)備份文本樣本;
針對(duì)各所述備份文本樣本,從當(dāng)前備份文本樣本中選取至少一個(gè)單詞,并將選取的所述單詞進(jìn)行內(nèi)容轉(zhuǎn)換,得到當(dāng)前備份文本樣本對(duì)應(yīng)的粒子文本樣本。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,從當(dāng)前備份文本樣本中選取至少一個(gè)單詞,包括:
獲取當(dāng)前備份文本樣本中各單詞分別對(duì)應(yīng)的選擇概率值;其中,所述各單詞分別對(duì)應(yīng)的選擇概率值是根據(jù)各單詞對(duì)所述文本分類模型的檢測(cè)結(jié)果的影響度確定的;
基于所述選擇概率值從所述當(dāng)前備份文本樣本中選取至少一個(gè)單詞。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)各單詞對(duì)所述文本分類模型的檢測(cè)結(jié)果的影響度確定所述各單詞分別對(duì)應(yīng)的選擇概率值,包括:
針對(duì)各單詞,獲取第一分類結(jié)果和第二分類結(jié)果;其中,第一分類結(jié)果是將去除當(dāng)前單詞后的原始文本樣本輸入所述文本分類模型后,所述文本分類模型輸出的分類結(jié)果;第二分類結(jié)果是將所述原始文本樣本輸入所述文本分類模型后,所述文本分類模型輸出的分類結(jié)果;
確定第一分類結(jié)果與第二分類結(jié)果之間的差異度,根據(jù)所述差異度確定當(dāng)前單詞對(duì)所述文本分類模型的檢測(cè)結(jié)果的影響度;
根據(jù)各單詞對(duì)所述文本分類模型的檢測(cè)結(jié)果的影響度確定各單詞對(duì)應(yīng)的選擇概率值;其中,影響度越大的單詞所對(duì)應(yīng)的選擇概率值越大。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)各單詞對(duì)所述文本分類模型的檢測(cè)結(jié)果的影響度確定各單詞對(duì)應(yīng)的選擇概率值,包括:
按照影響度從小到大的順序?qū)⒏鲉卧~進(jìn)行排序;
根據(jù)排序結(jié)果確定各單詞的排序序號(hào),其中位置越靠后的單詞的排序序號(hào)越大;
根據(jù)各單詞的排序序號(hào)確定各單詞的權(quán)重值,其中排序序號(hào)越大的單詞的權(quán)重值越大;
根據(jù)各單詞的權(quán)重值確定各單詞對(duì)應(yīng)的選擇概率值,其中權(quán)重值越大的單詞所對(duì)應(yīng)的選擇概率值越大。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,將當(dāng)前多個(gè)粒子文本樣本進(jìn)行更新,包括:
確定當(dāng)前多個(gè)粒子文本樣本中的全局最優(yōu)樣本和全局最差樣本;
針對(duì)當(dāng)前多個(gè)粒子文本樣本中的各粒子文本樣本,基于所述全局最優(yōu)樣本將當(dāng)前粒子文本樣本進(jìn)行第一內(nèi)容轉(zhuǎn)化操作,以提高當(dāng)前粒子文本樣本與所述全局最優(yōu)樣本之間的內(nèi)容接近度;
基于所述全局最差樣本將當(dāng)前粒子文本樣本進(jìn)行第二內(nèi)容轉(zhuǎn)化操作,以降低當(dāng)前粒子文本樣本與所述全局最差樣本之間的內(nèi)容接近度。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,確定當(dāng)前多個(gè)粒子文本樣本中的全局最優(yōu)樣本和全局最差樣本,包括:
獲取第二分類結(jié)果和當(dāng)前多個(gè)粒子文本樣本中各粒子文本樣本分別對(duì)應(yīng)的第三分類結(jié)果;其中,第二分類結(jié)果是將所述原始文本樣本輸入所述文本分類模型后,所述文本分類模型輸出的分類結(jié)果;第三分類結(jié)果是將對(duì)應(yīng)粒子文本樣本輸入所述文本分類模型后,所述文本分類模型輸出的分類結(jié)果;
確定與第二分類結(jié)果的接近度最低的第三分類結(jié)果,將所述接近度最低的第三分類結(jié)果所對(duì)應(yīng)的粒子文本樣本,作為全局最優(yōu)樣本;
確定與第二分類結(jié)果的接近度最高的第三分類結(jié)果,將所述接近度最高的第三分類結(jié)果所對(duì)應(yīng)的粒子文本樣本,作為全局最差樣本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010213381.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





