[發(fā)明專利]謠言檢測方法及設(shè)備有效
| 申請?zhí)枺?/td> | 201810198553.0 | 申請日: | 2018-03-12 |
| 公開(公告)號: | CN108491480B | 公開(公告)日: | 2021-05-11 |
| 發(fā)明(設(shè)計(jì))人: | 周凱敏;何永;李傳豐;武擁珍;舒暢;劉杰漢 | 申請(專利權(quán))人: | 義語智能科技(上海)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
| 地址: | 201203 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 謠言 檢測 方法 設(shè)備 | ||
1.一種謠言檢測方法,其中,該方法包括:
數(shù)據(jù)采集模塊,監(jiān)聽采集相關(guān)帖子,包括目標(biāo)對象發(fā)布的社交媒體的消息以及消息下的轉(zhuǎn)發(fā)和評論內(nèi)容,并按照固定的帖子條數(shù)采集一個(gè)序列的信息交由數(shù)據(jù)處理模塊處理,同時(shí)若一段時(shí)間內(nèi)沒有新消息,則就將目前采集到的帖子作為一個(gè)序列的信息交由所述數(shù)據(jù)處理模塊處理;
數(shù)據(jù)處理模塊,從數(shù)據(jù)采集模塊接收各個(gè)序列的信息,將每個(gè)序列的信息進(jìn)行數(shù)據(jù)清洗后,再進(jìn)行文本數(shù)值化處理得到消息矩陣,并將消息矩陣發(fā)送給謠言判別決策模塊;
謠言判別決策模塊,從所述數(shù)據(jù)處理模塊依次接收各個(gè)消息矩陣,并將每一個(gè)消息矩陣經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)和max pooling單元,將每一個(gè)消息矩陣轉(zhuǎn)換為一個(gè)對應(yīng)的矩陣向量;預(yù)設(shè)GRU單元的初始狀態(tài)為0向量,依次向所述GRU單元輸入一個(gè)消息矩陣,所述GRU單元依照當(dāng)前輸入的消息矩陣和前一個(gè)GRU單元狀態(tài)更新GRU單元的狀態(tài);依次記錄更新得到的GRU單元狀態(tài),并依次將更新得到的GRU單元狀態(tài)經(jīng)過全連接神經(jīng)網(wǎng)絡(luò),并通過softmax輸出,以計(jì)算得到能判斷和不能判斷謠言的概率;若向所述GRU單元繼續(xù)輸入某一個(gè)消息矩陣后,對應(yīng)計(jì)算得到的所述能判斷謠言的概率大于預(yù)設(shè)閾值,則結(jié)束向所述GRU單元繼續(xù)輸入下一個(gè)消息矩陣,將最后一次更新的GRU單元狀態(tài)發(fā)送給謠言判別模塊處理;
所述謠言判別模塊,將最后一次更新的謠言GRU單元狀態(tài),經(jīng)過全連接神經(jīng)網(wǎng)絡(luò),并通過softmax輸出,以計(jì)算得到所述采集的消息是否為謠言的概率;
結(jié)果記錄模塊,記錄下所述帖子和對應(yīng)的計(jì)算得到的消息是否為謠言的概率。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述數(shù)據(jù)清洗包括:
先將每個(gè)序列的信息中的非中文的內(nèi)容去除后,再對每個(gè)序列的剩余信息進(jìn)行分詞和去除停用詞,得到每個(gè)序列對應(yīng)的詞序列;預(yù)設(shè)一個(gè)最大詞長度,計(jì)算每個(gè)詞序列中各個(gè)詞的TF-IDF值,若某個(gè)詞序列中的詞的個(gè)數(shù)超過所述最大詞長度,則在該詞序列中保留所述TF-IDF值高于預(yù)設(shè)閾值的詞,以得到保留后的詞序列。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述進(jìn)行文本數(shù)值化處理,包括:
用word2vec訓(xùn)練的詞向量,將所述詞序列或保留后詞序列中的給個(gè)詞轉(zhuǎn)化為對應(yīng)的詞向量,按所述詞序列或保留后詞序列的詞的順序,將對應(yīng)的詞向量依次并列連接起來形成一個(gè)消息矩陣,其中,不足所述最大詞長度的詞序列或保留后詞序列,對應(yīng)的消息矩陣中用0向量填充。
4.根據(jù)權(quán)利要求1所述的方法,其中,記錄每次更新得到的GRU單元狀態(tài),將每次更新得到的GRU單元狀態(tài)經(jīng)過全連接神經(jīng)網(wǎng)絡(luò),并通過softmax輸出,以計(jì)算得到能判斷和不能判斷謠言的概率之后,還包括:
若不能判斷謠言的概率大于預(yù)設(shè)閾值,則等待向所述GRU單元輸入下一個(gè)消息矩陣,更新得到GRU單元狀態(tài),并記錄每次更新得到的GRU單元狀態(tài),將每次更新得到的GRU單元狀態(tài)經(jīng)過全連接神經(jīng)網(wǎng)絡(luò),并通過softmax輸出,以重新計(jì)算得到能判斷和不能判斷謠言的概率,
直至計(jì)算得到當(dāng)前一個(gè)消息矩陣的輸入對應(yīng)的能判斷謠言的概率大于預(yù)設(shè)閾值,則結(jié)束等待,將最后一次更新的謠言GRU單元狀態(tài)發(fā)送給謠言判別模塊處理,
或者直至所述等待下一個(gè)消息矩陣的輸入的時(shí)間超過預(yù)設(shè)的最晚判斷時(shí)間,則結(jié)束等待,將最后一次更新的謠言GRU單元狀態(tài)發(fā)送給謠言判別模塊處理。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述謠言判別決策模塊從所述數(shù)據(jù)處理模塊依次接收各個(gè)消息矩陣,并將每一個(gè)消息矩陣經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)和max pooling單元,將一個(gè)消息矩陣轉(zhuǎn)換為一個(gè)對應(yīng)的矩陣向量之前,還包括:
采用帶有預(yù)先標(biāo)準(zhǔn)結(jié)果的謠言數(shù)據(jù),首先訓(xùn)練所述謠言判別模塊,之后訓(xùn)練所述謠言判別決策模塊與訓(xùn)練所述謠言判別模塊交替進(jìn)行,其中,采用分類模型的訓(xùn)練方式訓(xùn)練所述謠言判別模塊,采用deep Q-Learning的訓(xùn)練方式訓(xùn)練所述謠言判別決策模塊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于義語智能科技(上海)有限公司,未經(jīng)義語智能科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810198553.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種信息監(jiān)控辟謠實(shí)現(xiàn)方法和裝置、移動終端
- 一種基于滲流分析的在線社交平臺謠言傳播的免疫方法
- 一種基于梯度提升樹的微博謠言檢測算法與謠言檢測特征集合
- 構(gòu)建謠言數(shù)據(jù)庫的方法、分析謠言數(shù)據(jù)的方法及電子設(shè)備
- 一種基于檢索輔助的謠言檢測方法及系統(tǒng)
- 一種檢測謠言的方法與設(shè)備
- 一種基于機(jī)器學(xué)習(xí)的謠言管理方法和裝置
- 基于爆發(fā)閾值及用戶體驗(yàn)的謠言抑制方法
- 一種網(wǎng)絡(luò)謠言識別方法及系統(tǒng)
- 微博謠言檢測模型訓(xùn)練方法、微博謠言檢測方法及裝置
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





