[發(fā)明專利]融合文本和傳播結(jié)構(gòu)的早期謠言檢測方法有效
| 申請?zhí)枺?/td> | 202011245311.6 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112329444B | 公開(公告)日: | 2022-09-02 |
| 發(fā)明(設(shè)計)人: | 陳晨;屠克非;袁曉潔 | 申請(專利權(quán))人: | 南開大學(xué) |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F16/35;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 天津耀達(dá)律師事務(wù)所 12223 | 代理人: | 張耀 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 融合 文本 傳播 結(jié)構(gòu) 早期 謠言 檢測 方法 | ||
1.融合文本和傳播結(jié)構(gòu)的早期謠言檢測方法,其特征是:將新聞的傳播結(jié)構(gòu)建模為傳播樹,構(gòu)造了聯(lián)合圖用以得到謠言傳播結(jié)構(gòu)的嵌入,并用兩個雙分支的CNN子模塊用以融合傳播結(jié)構(gòu)和新聞源文本的語言特征,該方法具體步驟如下:
第1、數(shù)據(jù)集的預(yù)處理
在數(shù)據(jù)的預(yù)處理階段,收集新聞的訓(xùn)練集樣本,其包括新聞的源文本以及用戶之間的轉(zhuǎn)發(fā)關(guān)系,在完成數(shù)據(jù)集的收集工作完成以后,將對數(shù)據(jù)集進(jìn)行預(yù)處理用以得到新聞的傳播結(jié)構(gòu)的特征表示;謠言的每個樣本包括三部分:新聞的源文本si,新聞的傳播樹Ti和新聞的標(biāo)注標(biāo)簽li;
第2、獲得新聞源文本和傳播結(jié)構(gòu)的向量表示
模型的輸入分成兩部分:一部分是新聞源文本的向量表示,另一部分則是代表著新聞傳播結(jié)構(gòu)的節(jié)點序列的向量表示;向量表示方法既利用序列表現(xiàn)了傳播結(jié)構(gòu)的序列特性,也利用聯(lián)合圖的嵌入表達(dá)了傳播結(jié)構(gòu)的結(jié)構(gòu)特征;
第3、訓(xùn)練融合傳播結(jié)構(gòu)和文本信息的謠言檢測模型
謠言檢測模型使用雙分支結(jié)構(gòu),每個結(jié)構(gòu)都是由多個卷積神經(jīng)網(wǎng)絡(luò)過濾器組成,雙分支的輸出由一個連接函數(shù)(concatenate)所拼接,并作為一個Softmax層的輸入,文本分支輸入的是新聞源文本的向量表示Vi,節(jié)點分支輸入的是新聞傳播結(jié)構(gòu)的向量表示Ni,給定(Vi,Ni),模型得到預(yù)測的類別li;
第1步包括:
第1.1、傳播樹的建模
謠言的傳播結(jié)構(gòu)的原始形式是一張表,其中的每個元素是兩個用戶之間的轉(zhuǎn)發(fā)關(guān)系,每個傳播關(guān)系可以看作是一條有向邊,其方向與新聞的轉(zhuǎn)發(fā)的方向相同,如果不同的邊整合起來,其會形成一個樹結(jié)構(gòu),這就是謠言的傳播樹結(jié)構(gòu);
其中傳播樹的具體定義如下:
令T<V,E>為一個新聞的傳播樹,其中V是節(jié)點的集合,其中的每個節(jié)點都是參與到新聞傳播的用戶,E是邊的集合,其中的每個元素代表著任意兩個用戶的一次轉(zhuǎn)發(fā)行為,其中對于任意節(jié)點vi屬于V,vi=(ui,ci,ti),其中ui代表著第i個用戶,ci代表著這一用戶的轉(zhuǎn)發(fā)的評論內(nèi)容,ti表示這一次轉(zhuǎn)發(fā)所發(fā)生的時刻;
第1.2、聯(lián)合圖的生成
為了更利用謠言的傳播結(jié)構(gòu)特征,特別是不同傳播結(jié)構(gòu)之間的相似之處,訓(xùn)練集中所有新聞的傳播樹都被合并到了一張聯(lián)合圖上去;
聯(lián)合圖的具體定義如下:
聯(lián)合圖Gu=<Vu,Eu>是生成自一個傳播樹的集合{Ti=<Vi,Ei>},其中Vu=∪iVi是傳播樹中所有點集合的并集,Eu=∪iEi是傳播樹集合中所有邊集合的并集;
第1.3、聯(lián)合圖的嵌入
被合并之后形成的聯(lián)合圖既包含了單個傳播樹的傳播結(jié)構(gòu)信息,也包含了傳播樹的之間的同構(gòu)結(jié)構(gòu)信息,基于隨機(jī)游走的圖嵌入模型可以得到聯(lián)合圖的每個節(jié)點的向量表示,這一獲得向量表示的過程可以看作是針對聯(lián)合圖的圖嵌入,針對聯(lián)合圖構(gòu)造了兩種圖嵌入方法:一種是針對帶權(quán)邊的圖嵌入,另一種是針對無權(quán)邊的圖嵌入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南開大學(xué),未經(jīng)南開大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011245311.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





