[發明專利]一種基于圖注意力網絡的社交機器人識別方法有效
| 申請號: | 202010044446.X | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111274491B | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 顏成鋼;阮定;孫垚棋;張繼勇;張勇東 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 網絡 社交 機器人 識別 方法 | ||
1.一種基于圖注意力網絡的社交機器人識別方法,其特征在于,步驟如下:
步驟(1)、搜集社交網絡數據;
人工搜集一段時間內社交平臺上部分賬號發布的內容,以及各賬號之間的評論關系;對社交平臺上某一賬號發布的內容進行記錄,搜集該條內容下的評論賬號發布的實質性評論內容以及評論的評論;同時根據賬號所發布的內容及評論關系判斷該賬號是否為機器人;
步驟(2)、創建數據集;
對所有搜集到的賬號發布的實質性內容進行自然語言處理獲取特征h,各個賬號作為圖的頂點,賬號間的評論關系形成圖的邊,并對每個賬號都注明是否為機器人,由此形成數據集;將數據集分為兩個部分,第一部分包括賬號的ID,特征h和類別,第二部分為各賬號之間的評論關系;其中訓練集,驗證集和測試集所占比例約為6:2:2;
步驟(3)、構建圖注意力網絡
將各賬號也就是節點的特征作為輸入,輸入圖注意力算法的網絡中,其中N是節點數量;是網絡輸出;注意力系數為其中W∈RF′×F,是權重矩陣,a為共享注意力機制:RF′×RF→R;為了能夠獲得結構信息,所以僅計算節點i的一階鄰域內的節點的注意力系數,即eij中的j∈Ni,Ni是節點i在圖中的一階鄰域;該一階鄰域由數據集第二部分構建的圖獲得;使用LeakyReLU對其非線性化,然后使用softmax進行規范化,最后得到的注意力系數為
其中,·T代表轉置,||表示連接操作;
然后引入多頭注意力機制,得到最終輸出;
其中K為多頭注意力機制中的頭數,可根據實際情況進行選擇;σ為非線性激活函數ELU;
最后對得到的使用log_softmax函數就可得到結果;
步驟(4)、訓練圖注意力網絡
用圖注意力網絡進行訓練;按照步驟(2)所述的比例選取訓練集和驗證集;采用Adam優化器,nll損失函數;在驗證過程中將正確率最高的網絡參數保存下來;
步驟(5)、圖注意力網絡的測試
訓練完成后,將測試集輸入在步驟(4)中保存下來的網絡中即可得到測試結果,可以用來判斷社交網絡賬號是否為機器人。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010044446.X/1.html,轉載請聲明來源鉆瓜專利網。





