[發明專利]一種基于社交網絡分析的微博詐騙團體挖掘方法在審
| 申請號: | 201611203131.5 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN106599273A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 賈志娟;張玉;周娜;孔珊;王寧 | 申請(專利權)人: | 賈志娟 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 450044 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 網絡分析 詐騙 團體 挖掘 方法 | ||
技術領域
本發明涉及網絡安全技術領域,具體涉及一種基于社交網絡分析的微博詐騙團體挖掘方法。
背景技術
近年來互聯網技術在國內外得到迅猛的發展,微博作為一種重要的社交平臺,
已經逐漸融入人們的日常生活中,給我們的生活和習慣帶來了很大的改變。微博作為信息發布和傳播的平臺,得到了越來越多的關注。與傳統的新聞媒體相對,微博提供的內容主題更廣發,更新和傳播的速度更快,信息的提供者更寬泛,網民們熱衷于在微博上分享自己的心情,評論當前流行的元素,探討當今的社會熱點,并關注自己的喜好,這給微博的數據挖掘帶來了相當大的價值,同時也使得詐騙團體的行動更加的便利。
社會網絡以用戶為基礎,具有主體繁多、用戶影響力差異顯著、用戶特征與信息資源復雜而且事件突發性強等特性。中國社會網絡環境比較復雜,尤其是詐騙謠言等信息對社會的影響較大,引導不當極容易引發社會矛盾。微博的出現進一步推動了社會網絡的發展。而且微博具有較為活躍的用戶量,若僅僅依靠傳統的統計方法無法高效的提取有價值的信息,這就急需一種更高效的能對海量文本數據進行分析和挖掘,社會網絡分析和數據挖掘技術就應運而生。因此利用社會網分析和數據挖掘技術對微博中詐騙團體的語言行為進行研究是可行的而且是很有必要的。
針對此現象,國內外相關學者做了大量的研究。2014年,王文帥、杜然等提出一個面向大規模微博數據的話題挖掘方法,首先對大規模微博數據進行分析,基于BloomFilter算法對數據進行去重處理,針對微博的特有結構,對文本進行預處理,然后提出改進的LAD主題模型SNLDA,采用吉布斯采樣法進行模型推導,挖掘出微博話題。李桃陶等運用圖數據挖掘技術和工具對微博用戶關聯關系進行處理,能夠發現用戶群體的特征,并能進行用戶推薦、事件分析、產品推廣和市場營銷等。廉捷等分別從互聯網數據采集與處理、社交網絡數據實證分析、用戶影響力與行為分析、用戶個性化推薦算法以及機器學習的信息預測算法鄧角度,對社交網絡中的挖掘方法進行了研究。
由于微博正處在如日中天,影響力覆蓋面不斷擴大的狀態,國內外文獻都在探討微博的正面作用,又或者在探討微博環境下的商業問題,而對于微博上存在的道德示范及如何規約的文獻并不多,尚未形成系統的學術研究專著,只能零散地在一些學術論文中出現一角。故本發明提出基于社交網絡的微博詐騙團體挖掘方法。該方法運用社交網絡分析與數據挖算法相結合來分析出微博中詐騙團體應該具備的特征,并挖掘出微博上潛在的詐騙團體,首先用爬蟲技術進行數據采集,然后對數據進行清洗,用Python中的結巴分詞對數據進行斷詞處理,之后用IF-IDF算法對這些詞進行排序,挖掘出詐騙團體的社交網絡特征和文本特征,最后根據不同團體之間的文本特征之間的相似度來挖掘出微博上的潛在詐騙團體。
發明內容
本發明的目的就是為了解決上述技術問題,而提供一種基于社交網絡分析的微博詐騙團體挖掘方法。
本發明包括以下步驟:
①.微博數據采集;
②.對所采集數據進行處理;
③.詐騙團體社交網絡分析特征獲取和文本特征的挖掘;
④.對詐騙團體進行預測和評估。
所述步驟①中的微博數據采集包括以下步驟:
a.首先模擬打開瀏覽器,并跳轉到話題所在的微博詳情頁;
b.通過Seleniu工具獲取到所述微博詳情頁頁面上的所有數據信息,并通過獲取DOM元素,定位到該條微博的轉發以及評論所在的地方;
c.將爬蟲得到的數據暫時保存,并將數據分類并處理;
d.接處理好的數據保存到本地的數據庫中,以供使用。
所述步驟②的數據處理包括對步驟①采集到的數據進行預處理、斷詞處理和特征值提取,所述預處理包括去重、機械壓縮去詞和短句刪除,所述特征值提取是采用TF-IDF算法來計算詞的重要性,最重要的詞即為特征值。
所述步驟③具體包括從整體社交網絡的角度對詐騙團體進行社會特征值的挖掘、通過網絡密度分析可以對詐騙團體的訓練集中社會網絡之內部節點互動鏈接的強度進行大致的了解、從網絡節點的角度進行分析和通過文本挖掘獲取特征關鍵詞。
所述步驟④包括內容特征對比和社會網絡特征對比。
本發明具有以下優點:本發明提供一種基于社交網絡分析的微博詐騙團體挖掘方法,幫助挖掘出微博上潛在的詐騙團體,使之以后的網民和企業免受詐騙信息的困擾。
附圖說明
圖1是一般的社交網絡示意圖。
圖2是本發明的微博詐騙團體挖掘方法的整體架構圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于賈志娟,未經賈志娟許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611203131.5/2.html,轉載請聲明來源鉆瓜專利網。





