[發明專利]一種基于社交網絡分析的微博詐騙團體挖掘方法在審
| 申請號: | 201611203131.5 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN106599273A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 賈志娟;張玉;周娜;孔珊;王寧 | 申請(專利權)人: | 賈志娟 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 450044 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 網絡分析 詐騙 團體 挖掘 方法 | ||
1.一種基于社交網絡分析的微博詐騙團體挖掘方法,其特征在于它包括以下步驟:
①.微博數據采集;
②.對所采集數據進行處理;
③.詐騙團體社交網絡分析特征獲取和文本特征的挖掘;
④.對詐騙團體進行預測和評估。
2.根據權利要求1所述的一種基于社交網絡分析的微博詐騙團體挖掘方法,其特征在于所述步驟①中的微博數據采集包括以下步驟:
a.首先模擬打開瀏覽器,并跳轉到話題所在的微博詳情頁;
b.通過Seleniu工具獲取到所述微博詳情頁頁面上的所有數據信息,并通過獲取DOM元素,定位到該條微博的轉發以及評論所在的地方;
c.將爬蟲得到的數據暫時保存,并將數據分類并處理;
d.接處理好的數據保存到本地的數據庫中,以供使用。
3.根據權利要求1所述的一種基于社交網絡分析的微博詐騙團體挖掘方法,其特征在于所述步驟②的數據處理包括對步驟①采集到的數據進行預處理、斷詞處理和特征值提取,所述預處理包括去重、機械壓縮去詞和短句刪除,所述特征值提取是采用TF-IDF算法來計算詞的重要性,最重要的詞即為特征值。
4.根據權利要求1所述的一種基于社交網絡分析的微博詐騙團體挖掘方法,其特征在于所述步驟③具體包括從整體社交網絡的角度對詐騙團體進行社會特征值的挖掘、通過網絡密度分析可以對詐騙團體的訓練集中社會網絡之內部節點互動鏈接的強度進行大致的了解、從網絡節點的角度進行分析和通過文本挖掘獲取特征關鍵詞。
5.根據權利要求1所述的一種基于社交網絡分析的微博詐騙團體挖掘方法,其特征在于所述步驟④包括內容特征對比和社會網絡特征對比。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于賈志娟,未經賈志娟許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611203131.5/1.html,轉載請聲明來源鉆瓜專利網。





