[發明專利]基于動態子圖生成方法挖掘關鍵局部爭論進行爭議性檢測的方法在審
| 申請號: | 202110689802.8 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113297497A | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 曹娟;鐘雷;盛強;謝添;徐朝喜 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 動態 生成 方法 挖掘 關鍵 局部 爭論 進行 爭議 檢測 | ||
1.一種基于路徑的動態子圖生成方法,包括:
步驟G1,基于帖子和評論建立帖子-評論圖,所述帖子-評論圖的節點包括帖子節點和評論節點,所述帖子-評論圖的邊表示節點之間的回復關系,所述帖子-評論圖的根節點為帖子節點;
步驟G2,基于帖子-評論圖建立路徑矩陣和路徑長度矩陣,其中,所述路徑矩陣記錄每個節點到所有終端節點的路徑;所述終端節點包括帖子節點或沒有回復的評論節點;所述路徑長度矩陣記錄每條路徑的長度;所述路徑的長度為節點到終端節點的邊的數目;
步驟G3,基于所述路徑矩陣和所述路徑長度矩陣獲取節點之間的相關度值;
步驟G4,基于節點之間的相關度值獲取節點對應的子圖。
2.根據權利要求1所述的方法,所述步驟G3中包括:
基于以下公式獲取歸一化的相關度矩陣,
R′=Softmax(P⊙R)
其中,R=QWsHT,Q=L′H,L′=I-S-1P,R′為歸一化的相關度矩陣,P為路徑矩陣,R為相關度矩陣,Q為中心節點的表達矩陣,矩陣H記錄了路徑矩陣中每個中心節點的d維表達向量,L′是L的歸一化矩陣,S為路徑長度矩陣,L是路徑拉普拉斯矩陣,L=S-P。
3.根據權利要求1所述的方法,所述路徑矩陣和路徑長度矩陣為方陣,其行數和列數為所述帖子-評論圖的所有路徑的數目;所述路徑長度矩陣的對角線元素為對應路徑的長度,除對角線之外的元素為0;所述路徑矩陣從根節點開始,按寬度優先原則遍歷帖子-評論圖的所有節點并記錄所有節點的路徑。
4.一種基于動態子圖生成方法挖掘關鍵局部爭論進行爭議性檢測的方法,包括:
步驟C1,基于權利要求1-3之一所述的動態子圖生成方法獲取帖子-評論圖中的所有子圖集合;
步驟C2,基于所述子圖集合,利用圖神經網絡預測帖子具有爭議性的概率。
5.根據權利要求4所述的爭議性檢測的方法,所述步驟C2還包括:
利用子圖中的節點信息更新中心節點的表達;
基于子圖中所有節點與其回復節點的差異獲得每個子圖的表達向量;
基于所有子圖的表達向量的加權求和結果判斷帖子的爭議性。
6.根據權利要4所述的爭議性檢測的方法,用于訓練所述圖神經網絡的損失函數為
其中,代表第i個帖子的真實標簽,為模型預測的第i個帖子具有爭議性的概率,N為訓練時批次的大小。
7.根據權利要求5所述的爭議性檢測的方法,采用以下公式計算子圖的表達向量,
其中,表示子圖的表達向量,是可學習的參數矩陣,表示子圖中節點之間的節點表達的差異,是偏置項矩陣。
8.根據權利要求7所述的爭議性檢測的方法,采用帖子引導的注意力機制獲取所有子圖的表達向量加權求和結果,用以下公式表示,
其中,
u表示所有子圖表達向量的加權求和結果,表示子圖的表達向量,hp代表帖子節點的表達向量,SG代表“帖子-評論”圖中的所有子圖集合,是注意力機制的權重,代表子圖SGi與帖子的相關度。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其中,該程序被處理器執行時實現根據權利要求1至8任一項所述方法的步驟。
10.一種計算機設備,包括存儲器和處理器,在所述存儲器上存儲有能夠在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現權利要求1至8任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110689802.8/1.html,轉載請聲明來源鉆瓜專利網。





