[發明專利]對抗樣本生成方法、裝置、電子設備和計算機可讀介質在審
| 申請號: | 201910684104.1 | 申請日: | 2019-07-26 |
| 公開(公告)號: | CN110378474A | 公開(公告)日: | 2019-10-25 |
| 發明(設計)人: | 苗寧;周浩;李磊 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04 |
| 代理公司: | 北京衛智暢科專利代理事務所(普通合伙) 11557 | 代理人: | 陳佳 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選文本 結果信息 文本處理 訓練樣本 樣本文本 計算機可讀介質 對抗 電子設備 樣本生成 樣本 標注信息 處理模型 生成步驟 輸入文本 預設條件 期望 | ||
本公開的實施例公開了對抗樣本生成方法、裝置、電子設備和計算機可讀介質。該方法的一具體實施方式包括:對于訓練樣本集中的訓練樣本,執行以下生成步驟,其中,訓練樣本包括樣本文本和該樣本文本對應的標注信息:生成該樣本文本對應的候選文本;將該候選文本輸入文本處理模型,得到文本處理結果信息;若該候選文本對應的文本處理結果信息滿足預設條件,將該候選文本以及該候選文本對應的文本處理結果信息確定為對抗樣本。該實施方式實現了控制對抗樣本向著期望的方向生成。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及對抗樣本生成方法、裝置、電子設備和計算機可讀介質。
背景技術
隨著人工智能的發展,相關技術已廣泛應用于各個領域。例如,圖像識別、語音識別、自然語言處理等領域,人工智能技術均發揮了舉足輕重的作用。人工智能技術的應用,使得人與機器的交互更加便利。與此同時,由于各種功能的實現有賴于通過大量的樣本的訓練。訓練后的神經網絡對于干擾比較敏感,可能影響神經網絡的安全性。為了提高神經網絡的抗干擾性,需要基于對抗樣本對神經網絡進行訓練。因而對于生成對抗樣本提出了需求。
發明內容
本發明內容部分用于以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。本發明內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
本公開的一些實施例提出了對抗樣本生成方法、裝置、電子設備和計算機可讀介質。
第一方面,本公開的一些實施例提供了一種對抗樣本生成方法,包括:對于訓練樣本集中的訓練樣本,執行以下生成步驟,其中,訓練樣本包括樣本文本和該樣本文本對應的標注信息:生成該樣本文本對應的候選文本;將該候選文本輸入文本處理模型,得到文本處理結果信息;若該候選文本對應的文本處理結果信息滿足預設條件,將該候選文本以及該候選文本對應的文本處理結果信息確定為對抗樣本。
第二方面,本公開的一些實施例提供了一種對抗樣本生成裝置,包括:執行單元,被配置成對于訓練樣本集中的訓練樣本,利用所包括的子單元進行對抗樣本的生成,其中,訓練樣本包括樣本文本和該樣本文本對應的標注信息,執行單元包括以下子單元:生成子單元,被配置成生成該樣本文本對應的候選文本;文本處理結果信息生成子單元,被配置成將該候選文本輸入文本處理模型,得到文本處理結果信息;第一確定子單元,被配置成若該候選文本對應的文本處理結果信息滿足預設條件,將該候選文本以及該候選文本對應的文本處理結果信息確定為對抗樣本。
第三方面,本公開的一些實施例提供了一種電子設備,包括:一個或多個處理器;存儲裝置,其上存儲有一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現如第一方面中任一實現方式描述的方法。
第四方面,本公開的一些實施例提供了一種計算機可讀介質,其上存儲有計算機程序,其中,程序被處理器執行時實現如第一方面中任一實現方式描述的方法。
本公開的一些實施例提供的對抗樣本生成方法、裝置、電子設備和計算機可讀介質,通過生成樣本文本的候選文本,以及將候選文本輸入文本處理模型,得到文本處理結果信息。在此基礎上,若該候選文本對應的文本處理結果信息滿足預設條件,將該候選文本以及該候選文本對應的文本處理結果信息確定為對抗樣本。其中,通過控制預設條件,可以控制對抗樣本向著期望的方向生成。例如,控制預設條件使得候選文本對應的文本處理結果信息與樣本文本對應的標注信息不同,甚至相反??梢允沟脤箻颖鞠蚋吖粜缘姆较蛏?。
附圖說明
結合附圖并參考以下具體實施方式,本公開各實施例的上述和其他特征、優點及方面將變得更加明顯。貫穿附圖中,相同或相似的附圖標記表示相同或相似的元素。應當理解附圖是示意性的,原件和元素不一定按照比例繪制。
圖1是本公開的一些實施例可以應用于其中的示例性系統的架構圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910684104.1/2.html,轉載請聲明來源鉆瓜專利網。





