[發明專利]神經網絡分類識別中的對抗樣本生成的方法和裝置在審
| 申請號: | 202010417999.5 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111461261A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 卜磊;段玉超;金亦凡;王林章;李宣東 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 江蘇銀創律師事務所 32242 | 代理人: | 孫計良 |
| 地址: | 210001 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 分類 識別 中的 對抗 樣本 生成 方法 裝置 | ||
本發明公開了神經網絡分類識別中的對抗樣本生成的方法和裝置。本發明架構了一種對抗樣本自動化生產的平臺,在這平臺中,用戶可按照特定樣本的應用場景構建出相應的合成函數、不滿足度評估函數、噪音空間收縮策略函數組成特定的搜索策略,然后通過本發明的平臺自動生成對抗樣本,由此固化對抗樣本生成的算法,對某種特定樣本生成對抗樣本效率低的情形時,用戶僅需要改變其中的搜索策略即可改進對抗樣本的生成效率。
技術領域
本發明涉及神經網絡分類識別,特別涉及有關對抗樣本的技術。
背景技術
近年來深度學習技術的迅猛發展,使得機器在視覺、聽覺等多方面表現與人類機能相媲美。如今用于圖像識別的深度神經網絡模型已經被廣泛應用在各行各業,包括身份驗證、自動駕駛等安全敏感型領域,因此神經網絡自身的安全性至關重要。而神經網絡模型通過訓練所得,具有較弱的可解釋性和邏輯性,因此神經網絡模型具有較大的安全隱患。
相關研究表明,神經網絡易受到對抗樣本的影響。對抗樣本與原始輸入非常相近,而神經網絡對其分類的結果卻截然不同。研究對抗樣本有助于提高神經網絡的魯棒性和安全性。而研究對抗樣本首先需要解決的是如何得到對抗樣本,然后才能研究對抗樣本。
生成對抗樣本解決的問題是給定一個能夠正確識別的樣本,在該樣本添加一定量的噪音后,使得神經網絡無法正確分類識別。但生成對抗樣本實質上的問題在于對抗樣本生成的效率問題。假如存在對抗樣本,那么通過無限的遍歷搜索總能找到這樣的對抗樣本,但是盲目的遍歷搜索效率太低,耗時很長,甚至有可能在太陽熄滅前也無法找到這樣的對抗樣本,這種盲目的遍歷搜索毫無實際應用價值。現有技術已經存在一些對抗樣本的生成方法,但這些對抗樣本的生成方法本質上也還是遍歷搜索。實質上這樣的遍歷搜索過程可以相對比較是固化,在面對不同的樣本時,提供不同的搜索策略,即可大幅提高對抗樣本生成效率。
發明內容
本發明所要解決的問題:將神經網絡分類識別中的對抗樣本生成過程固化使得用戶僅需要提供或改進特定樣本的搜索策略即可提高對抗樣本生成的效率。
為解決上述問題,本發明采用的方案如下:
根據本發明的神經網絡分類識別中的對抗樣本生成的方法,該方法包括如下步驟:
S1:獲取用戶輸入的分類輸入和噪音空間并獲取用戶定義的合成函數fsyn和不滿足度評估函數fdis;其中,分類輸入為通道向量,通道向量的每個元素為通道值;噪音空間為區間向量,區間向量的每個元素為定義了噪音下限和噪音上限的噪音區間;分類輸入和噪音空間具有相同維度;
分類輸入di|i∈[1..k]表示為第i通道的通道值;
噪音空間Δi=[lowi,upi]|i∈[1..k],lowi,upi表示為第i通道的噪音區間的噪音下限值和噪音上限值;
所述合成函數fsyn用于定義兩個通道向量的合成方法,其輸入為兩個通道向量,其中一個通道向量為分類輸入向量,另一個通道向量為噪音向量,其輸出為兩個通道向量合成后的分類輸入向量;
所述不滿足度評估函數fdis用于定義對識別分類結果的不滿足度評估,其輸入參數有兩個,其中一個是最佳標簽,另一個是識別分類結果,其輸出為識別分類結果的不滿足度值;識別分類結果是神經網絡對分類輸入進行分類識別后得到的各分類標簽的概率分布圖;
S2:通過神經網絡對所述分類輸入進行分類識別得到識別分類結果,并根據識別分類結果的各分類標簽的概率分布圖選取其中概率最大的分類標簽作為目標優選分類標簽labeld;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010417999.5/2.html,轉載請聲明來源鉆瓜專利網。





