[發(fā)明專利]基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法及裝置有效
| 申請?zhí)枺?/td> | 202110402464.5 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113139052B | 公開(公告)日: | 2022-04-19 |
| 發(fā)明(設(shè)計)人: | 馬凱;劉小迪;徐守志;馬圓圓;向舜陟 | 申請(專利權(quán))人: | 三峽大學(xué) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30;G06N3/04 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 楊云云 |
| 地址: | 443002 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 神經(jīng)網(wǎng)絡(luò) 特征 聚合 謠言 檢測 方法 裝置 | ||
本發(fā)明提供一種基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法及裝置,方法包括:獲取第一事件源文本圖;將第一事件源文本圖和訓(xùn)練標(biāo)簽輸入至預(yù)設(shè)第一圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,以確定圖神經(jīng)網(wǎng)絡(luò)預(yù)測模型;將待檢測的第一事件源文本圖輸入至圖神經(jīng)網(wǎng)絡(luò)預(yù)測模型,以對互聯(lián)網(wǎng)中的事件源文本及響應(yīng)推文進(jìn)行謠言檢測。所述裝置用于執(zhí)行上述方法。本發(fā)明提供的基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法,使用得到的圖神經(jīng)網(wǎng)絡(luò)預(yù)測模型對互聯(lián)網(wǎng)的事件源文本及響應(yīng)推文進(jìn)行檢測,能夠保留社交媒體中的信息傳播結(jié)構(gòu),更好地將事件的響應(yīng)推文特征與事件源推文特征相融合,從文本級粒度和詞語級粒度進(jìn)行謠言判別。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其涉及一種基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法及裝置。
背景技術(shù)
謠言指沒有相應(yīng)事實基礎(chǔ),卻被捏造出來并通過一定手段推動傳播的言論。社交媒體上的謠言具有碎片化、網(wǎng)絡(luò)化、范圍廣、速度快的特點(diǎn)。謠言檢測技術(shù)和方法通過對現(xiàn)有計算機(jī)相關(guān)知識和技能的運(yùn)用,在網(wǎng)絡(luò)社交平臺上對謠言進(jìn)行識別。
現(xiàn)有謠言檢測技術(shù)存在如下問題:1)現(xiàn)有的謠言檢測研究無法較好地捕捉到文本中上下文及前后詞的關(guān)系;2)謠言檢測研究使用頻率較高的文本向量化方法word2vec和GloVe無法將一詞多義現(xiàn)象和上下文語境在詞向量中體現(xiàn)出來;3)現(xiàn)有的基于圖的研究傾向于從單一粒度入手對謠言文本或謠言傳播結(jié)構(gòu)進(jìn)行謠言檢測。
發(fā)明內(nèi)容
本發(fā)明提供的基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法,用于克服現(xiàn)有技術(shù)中存在的至少一個問題,使用得到的圖神經(jīng)網(wǎng)絡(luò)預(yù)測模型對互聯(lián)網(wǎng)的事件源文本及響應(yīng)推文進(jìn)行檢測,能夠保留社交媒體中的信息傳播結(jié)構(gòu),更好地將事件的響應(yīng)推文特征與事件源推文特征相融合,從文本級粒度和詞語級粒度進(jìn)行謠言判別。本發(fā)明提供一種基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法,包括:
獲取第一事件源文本圖;
將所述第一事件源文本圖和訓(xùn)練標(biāo)簽輸入至預(yù)設(shè)第一圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,以確定圖神經(jīng)網(wǎng)絡(luò)預(yù)測模型;
將待檢測的第一事件源文本圖輸入至所述圖神經(jīng)網(wǎng)絡(luò)預(yù)測模型,以對互聯(lián)網(wǎng)中的事件源文本及響應(yīng)推文進(jìn)行謠言檢測;
其中,事件源文本圖是通過將所述事件源文本進(jìn)行圖結(jié)構(gòu)建模得到的;
所述訓(xùn)練標(biāo)簽是通過采用預(yù)設(shè)編碼方式對所述事件源文本和所述響應(yīng)推文進(jìn)行標(biāo)注后得到的。
根據(jù)本發(fā)明提供的一種基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法,所述獲取第一事件源文本圖,包括
對事件源推文預(yù)處理,并對預(yù)處理后的事件源推文進(jìn)行圖結(jié)構(gòu)建模,以獲取第二事件源推文圖;
將所述第二事件源推文圖輸入至訓(xùn)練好的第二圖神經(jīng)網(wǎng)絡(luò)模型,以獲取事件源推文的文本級特征向量;
根據(jù)事件源文本的詞向量和所述文本級特征向量,獲取所述第一事件源文本圖;
其中,所述事件源推文包括所述事件源文本和所述響應(yīng)推文。
根據(jù)本發(fā)明提供的一種基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法,所述對事件源推文預(yù)處理,包括:
去除所述事件源文本中的亂碼數(shù)據(jù)和空行數(shù)據(jù);以及
去除所述事件源的響應(yīng)推文的冗余項;
其中,所述冗余項包括轉(zhuǎn)發(fā)但未評論的事件源的響應(yīng)推文、亂碼數(shù)據(jù)和空行數(shù)據(jù)。
根據(jù)本發(fā)明提供的一種基于圖神經(jīng)網(wǎng)絡(luò)特征聚合的謠言檢測方法,所述事件源文本的詞向量通過如下方式獲取:
去除所述事件源文本中的亂碼數(shù)據(jù)和空行數(shù)據(jù),獲取滿足預(yù)設(shè)條件的事件源文本;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三峽大學(xué),未經(jīng)三峽大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110402464.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





