[發明專利]基于動態子圖生成方法挖掘關鍵局部爭論進行爭議性檢測的方法在審
| 申請號: | 202110689802.8 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113297497A | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 曹娟;鐘雷;盛強;謝添;徐朝喜 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 動態 生成 方法 挖掘 關鍵 局部 爭論 進行 爭議 檢測 | ||
本發明提供一種基于動態子圖生成方法挖掘關鍵局部爭論進行爭議性檢測的方法,包括:步驟C1,基于動態子圖生成方法獲取帖子?評論圖中的所有子圖集合;步驟C2,基于所述子圖集合,利用圖神經網絡預測帖子具有爭議性的概率。本發明能挖掘出帖子內容相關的爭論進行爭議性檢測,能夠應對數據中存在的無關信息,能提高圖神經網絡的檢測性能。
技術領域
本發明涉及社交媒體平臺爭議性檢測領域,具體涉及一種基于動態子圖生成方法挖掘關鍵局部爭論進行爭議性檢測的方法。
背景技術
社交媒體平臺已經成為了人們表達觀點的重要平臺。人們在社交媒體上進行分享、評論,并在部分帖子中引起了激烈的討論,表明參與的人之間存在爭議,這些有爭議的帖子反映了公眾的情感和關注點。根據Coletto et al.,2017[1],一個有爭議的帖子具有可爭議的內容,并且所表達的想法或觀點會在回復中引起爭論。帖子級別的爭議性檢測任務目標則是自動確定一個帖子是否具有爭議性。該任務有助于評估人們觀點的兩極分化以及事件的影響力(Hessel and Lee,2019)[2],還為新聞主題選擇提供參考。爭議性檢測在挖掘社交媒體公眾情緒方面具有重要的作用,近年來已經成為人們的研究熱點。
目前的爭議性檢測方法(Zhong et al.,2020)[3]首先通過“帖子-評論樹”構建圖結構,圖中的節點代表帖子或者評論,邊代表節點之間的回復關系。然后使用圖卷積神經網絡來學習圖中節點的表示,并使用帖子和評論的平均信息來進行爭議性檢測。該方法無法利用節點相關的局部討論進行節點表達的更新,并且無法對爭論模式進行建模、無法關注到和帖子相關的信息。
在實際場景中,一個貼子的爭議性往往體現在帖子的局部討論(LocalDiscussion,簡稱LD)中,這些局部討論是指和當前節點相關的討論內容,在“帖子-評論樹”圖中具體表現為一個子圖。有的局部討論中存在爭論,有的則沒有,人們將那些存在爭論的局部討論稱為局部爭論(Local Argument)。而帖子中的討論有的是和帖子相關的,有的則是離題的,人們將那些和帖子相關的局部爭論稱為關鍵局部爭論(Key Local Argument,簡稱KLA)。存在關鍵局部爭論的帖子很可能是有爭議的帖子,因此尋找關鍵局部爭論將有助于進行帖子的爭議性檢測。
圖1展示了微博平臺一個討論“產假”和“陪產假”的爭議性帖子以及評論的內容,評論內容的立場分為“支持”“反對”“中立”以及“無關”4個方面。圖2展示的是圖1帖子-評論的回復關系圖,帖子中存在的部分局部討論已由虛線圈標出,例如圖中的LD1~LD3。在這些局部討論中,LD2和LD3中存在爭論,并且屬于和帖子相關的討論,因此LD2和LD3屬于關鍵局部爭論,即圖中的KLA1和KLA2。基于圖1和圖2的觀察,利用關鍵局部爭論進行爭議性檢測可以分兩步進行:(1)首先找出帖子中存在的局部討論;(2)找出其中和帖子相關的,并最可能存在爭論的局部討論進行爭議性檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110689802.8/2.html,轉載請聲明來源鉆瓜專利網。





