[發明專利]虛假網絡輿情識別方法在審
| 申請號: | 201810451684.5 | 申請日: | 2018-05-12 |
| 公開(公告)號: | CN108563798A | 公開(公告)日: | 2018-09-21 |
| 發明(設計)人: | 趙喬 | 申請(專利權)人: | 蘇州華必訊信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215300 江蘇省蘇州市昆山市玉*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡輿情識別 網絡輿情 關聯性 關聯性分析 空間關聯性 時間關聯性 信息量減少 建模分析 網絡論壇 網絡熱點 網絡信息 信息傳播 行為分析 行為特征 網絡 互聯網 檢測 | ||
1.一種虛假網絡輿情識別方法,其特征在于包括以下步驟:
步驟一、利用網絡數據采集工具,從互聯網中需要監測的網絡論壇上采集網絡發帖信息、發帖用戶信息、帖子內容、回帖用戶信息以及回帖內容,提取其中的元信息,網絡信息經過預處理后存入數據庫待分析;
步驟二、對于每個被監測的網絡論壇,按下列方法檢測是否存在網絡輿情或熱點事件;
以用戶為節點,用戶之間的聯系為節點之間的連線,建立用戶-用戶網絡模型;通過用戶-用戶之間的聯系形成有向網絡,在一個帶值的有向網絡中,一個節點的威望度是指這個節點的入度與所有節點的入度和的比值,威望度計算公式如下:
<math> <mrow> <msub> <mi>P</mi> <mi>D</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>-</mo> </mrow> </msub> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow><mi>n</mi> </munderover> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>-</mo> </mrow> </msub> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </math>
式中,xi-表示節點vi入度;入度是指所有指向該節點的所有連線上數值之和;
在一個帶值的有向網絡中,一個節點的中心度是指這個節點的出度與所有節點的出度和的比值;中心度計算公式如下:
<math> <mrow> <msub> <mi>C</mi> <mi>D</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>+</mo> </mrow> </msub> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow><mi>n</mi> </munderover> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>+</mo> </mrow> </msub> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow> </math>
式中,xi+表示節點vi的出度;出度是指所有指向其他結點的所有連線上數值之和;
建立用戶-事件網絡模型,通過用戶與事件之間的聯系形成無向網絡;
事件的中心度是指參與該事件的人數與總人數個數的比值;事件的中心度計算公式如下:
<math> <mrow> <msub> <mi>C</mi> <mi>E</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>e</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msub> <mi>x</mi> <mi>i</mi> </msub> <mi>m</mi> </mfrac> <mo>-</mo> <mo>-</mo><mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow> </math>
式中,xi表示參與事件ei的用戶,m表示該用戶-事件網絡模型中總的用戶個數;
將用戶從網絡中剝離出來,建立事件-事件網絡模型,計算出事件之間的關聯度;利用用戶-用戶網絡模型計算出節點的威望度和中心度,檢測出威望度和中心度值大的用戶,利用用戶-事件網絡模型計算出事件中心度,檢測出中心度值大的事件;將用戶-事件網絡模型轉換成事件-事件網絡模型,計算出帖子之間的關聯度,找出屬于同一個主題的帖子,判斷是否網絡水軍發的帖子;
步驟三、根據網絡水軍發帖行為和帖子特征,對不同網絡論壇出現的網絡輿情或熱點事件進行多層面分析,識別出可能存在的虛假網絡輿情;
(1)對每一個ID賬號發帖時所使用的IP地址進行統計分析,計算出同一個IP地址的帖子量;通過空間關聯性分析,檢測出不同網絡論壇上熱點事件帖子的ID賬號與 IP地址之間關聯性,計算它們的空間關聯度;
(2)通過時間關聯性分析,檢測出不同網絡論壇上熱帖的時間關聯性,計算它們的時間關聯度;
(3)通過主題內容語義分析,檢測出不同網絡論壇上熱帖的主題關聯性,計算它們的主題關聯度;
(4)通過對不同網絡論壇上熱帖所表達的情感進行多層次分析,包括詞匯、句子和文檔,檢測出不同網絡論壇上熱帖的情感關聯性,計算它們的情感關聯度;
(5)根據對所有網絡熱點事件的關聯性分析結果,如果一個網絡熱點事件同時具有上述四個關聯度,則該網絡熱點事件為虛假網絡輿情;如果一個網絡熱點事件同時具有上述三個關聯度,則該網絡熱點事件為高度疑似虛假網絡輿情;如果一個網絡熱點事件同時具有上述二個關聯度,則該網絡熱點事件為一般疑似虛假網絡輿情。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州華必訊信息科技有限公司,未經蘇州華必訊信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810451684.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種網頁內容有分頁的抓取方法
- 下一篇:一種動態生成輿情簡報的方法





