[發明專利]一種用于文檔分類的基于強化學習的通過添加虛假節點的圖對抗樣本生成方法有效
| 申請號: | 201910496324.1 | 申請日: | 2019-06-10 |
| 公開(公告)號: | CN110334742B | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 李瑩;陳裕;尹建偉;鄧水光 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 文檔 分類 基于 強化 學習 通過 添加 虛假 節點 對抗 樣本 生成 方法 | ||
本發明公開了一種基于強化學習的通過添加虛假節點的圖對抗樣本生成方法,包括:(1)獲取原圖數以及圖節點分類模型,構造訓練集和測試集;向原圖數據中添加虛假節點,得到初始的對抗樣本;(2)構建攻擊模型;(3)在訓練集中選擇攻擊目標;(4)把當前的對抗樣本和攻擊目標輸入攻擊模型,選擇評估值最大的節點,構造新的對抗樣本;(5)將新的對抗樣本輸入分類模型,若分類結果為目標的結果,得到對抗樣本并進行下一步,否則跳轉步驟(4);(6)對攻擊模型進行訓練,并使用訓練好的攻擊模型進行測試和應用。本發明通過添加虛假節點的方法來生成圖的對抗樣本,能夠為設計出更加魯棒的圖深度學習模型提供幫助。
技術領域
本發明屬于人工智能信息安全技術領域,尤其是涉及一種基于強化學習的通過添加虛假節點的圖對抗樣本生成方法。
背景技術
圖論中的圖是由若干給定的點及連接兩點的線所構成的圖形,這種圖形通常用來描述某些事物之間的某種特定關系,用點代表事物,用連接兩點的線表示相應兩個事物間具有某種關系。圖論中的圖G是一個有序二元組(V,E),其中V稱為頂點集,即圖中所有頂點組成的集合,E稱為邊集,即所有頂點之間的邊組成的集合。簡單的說,頂點表示事物,邊表示事物之間的關系。另外對于屬性圖(Attributed Graph)可以表示為一個有序二元組(A,X),其中A稱為圖的鄰接矩陣,X表示圖中節點特征的特征矩陣。
圖作為一種重要且廣泛使用的數據結構,已經被用于各種各樣的實際應用場景中,例如社交網絡中的擴散圖,電子商務中的用戶偏好圖以及生物學中國的蛋白質結構圖。圖挖掘領域的主要研究包括圖分類、圖聚類、節點分類等。其中節點分類任務是圖上最重要的任務之一。節點分類任務針對一個圖數據,通過對圖中已知類別的節點數據的學習來簡歷分類預測模型,實現對圖中未知類別的節點進行分類。例如,在社交網絡中的用戶電影偏好預測就是一個典型的節點分類問題,在該問題中,可以用圖的節點表示用戶,邊表示用戶之間的關系,用戶對電影的興趣作為標簽,通過節點分類方法進行預測可以推測目標人群的興趣并向他們推薦相關電影。
圖節點分類問題像大部分分類問題一樣,可以通過各種深度神經網絡模型來解決,其中圖卷積網絡(Graph Convolutional Networks,GCNs)是目前效果最好的方法,所以在本發明中使用圖卷積網絡(GCN)為例。然而許多深度神經網絡模型已經被證明魯棒性不強:通過對預測目標加上一個微小的擾動,能夠使分類器的預測結果被誤導,這種攻擊方式被稱為對抗攻擊(Adversarial Attack),攻擊生成的樣本被稱為對抗樣本(AdversarialSamples)。對抗攻擊按攻擊者對目標模型的了解程度可以分為白盒攻擊和黑盒攻擊。白盒攻擊指攻擊者對模型完全了解,包裹模型結構、所有參數等;黑盒攻擊則不知道模型結構、參數,但能觀察到模型的輸出結果。對抗攻擊按攻擊者的意圖又可以分為非指向性攻擊(Non-targeted Attack)和指向性攻擊(Targeted Attack)。非指向性攻擊是指攻擊者的目的是改變目標的分類結果,對于分類結果是哪一類沒有要求;而指向性攻擊的目標是使得目標的分類結果被劃分到某個特定的類別中。在本發明中,已指向性攻擊為例。
目前對抗攻擊方面的研究大多數幾種在圖像領域,最主要的方法是通過梯度下降算法計算分類結果損失之于輸入圖像的梯度,進而計算添加的擾動。而在圖數據領域,目前的研究都是通過添加或刪除現有的邊或節點特征來使得目標節點的分類結果被誤導。但是這種方法在實際場景中可能很難實現,例如在社交網絡中,想要刪除或添加兩個用戶之間的邊就可能需要得到這些用戶的登錄權限,但是這在實際情況中較難獲得。
發明內容
針對現有技術的不足,本發明提出了一種基于強化學習的通過添加虛假節點的圖對抗樣本生成方法,通過強化學習方法將添加虛假節點生成對抗樣本看作是機器和圖節點分類模型環境交互的決策過程,機器通過不斷地為虛假節點添加邊和特征,收集模型分類結果信息,進而生成對抗樣本。
本發明的技術方案如下:
一種基于強化學習的通過添加虛假節點的圖對抗樣本生成方法,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910496324.1/2.html,轉載請聲明來源鉆瓜專利網。





