[發明專利]微博營銷賬號的識別方法及系統有效
| 申請號: | 201410093704.8 | 申請日: | 2014-03-13 |
| 公開(公告)號: | CN103905532B | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 馮術葵;莊寶玉 | 申請(專利權)人: | 微夢創科網絡科技(中國)有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08;H04L29/12 |
| 代理公司: | 北京市京大律師事務所11321 | 代理人: | 張璐,方曉明 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 營銷 賬號 識別 方法 系統 | ||
技術領域
本發明涉及互聯網技術,尤其涉及一種微博營銷賬號的識別方法及系統。
背景技術
微博是一種基于用戶關系信息分享、傳播以及獲取的平臺。其憑借內容發布的便捷性、信息傳播的即時性、信息內容的豐富性等特點贏得了數以億計的用戶。與此同時,無論是企業、團體還是個人都發現了微博平臺潛藏的巨大商業價值。為了實現利益訴求,他們通過多種營銷手段獲得影響力從而牟利。其中,通過微博營銷賬號(又稱,微博水軍)進行宣傳和炒作來實現營銷目標是目前常用的方法。然而,這種方法具有趨利性,往往對競爭對手的微博進行惡意評論、詆毀,或者發布虛假信息,嚴重損害了他人利益。因此,有效的識別微博賬號對凈化微博平臺環境大有裨益。
目前,一種識別微博營銷賬號的方法主要通過對賬號屬性和發布的博文內容進行判斷。具體地,賬號屬性,即賬號注冊時的信息,包括:用戶名、昵稱、年齡、簽名、愛好等等。結合賬號屬性和發布的博文內容,將具有異常屬性和發布異常博文的賬號歸為微博營銷賬號。然而,由于微博營銷賬號多數具有隱藏性,注冊信息的填寫與正常用戶的微博賬號并無明顯差異,僅通過賬號屬性很難識別出微博營銷賬號。進一步,微博營銷賬號各自發布的廣告微博內容不同,形式多樣,憑借抽取的單個微博賬號發布的微博內容,從個體角度進行識別容易對賬號造成誤判。
此外,現有技術中還存在一種識別微博營銷賬號的方法。該方法針對微博賬號轉發微博、評論微博、關注粉絲等行為制定出行為標準,提取單個待識別微博賬號的上述行為與行為標準進行比較,如果該行為超出行為標準,則將該賬號認定為微博營銷賬號。
然而,上述方法僅適用于識別傳統意義的微博營銷賬號。對于目前出現的具有模擬正常微博賬號的轉發微博、評論微博、關注粉絲等行為、反識別特征的微博營銷賬號,則難以識別出來。也就是說,采用該方法對單個微博賬號進行識別判斷,具有模擬正常微博賬號行為的微博營銷賬號容易被誤判成正常微博賬號。因此有必要提供能夠一種具有更高識別準確率的微博營銷賬號的識別方法及系統。
發明內容
本發明實施例提供了一種微博營銷賬號的識別方法及系統,用以提高微博營銷賬號的識別準確率。
根據本發明的一個方面,提供了一種微博營銷賬號的識別方法,包括:
獲取群體微博賬號中每個微博賬號登錄時所使用的IP地址;
對于每個獲取的IP地址,統計登錄時使用該IP地址的微博賬號的數量;若統計出的數量大于第一閾值,則將登錄時使用該IP地址的微博賬號的疑似度增加第一步長值;
將疑似度大于設定值的微博賬號識別為微博營銷賬號。
在所述將疑似度大于設定值的微博賬號識別為微博營銷賬號之前,還包括:
對于每個微博賬號,獲取該微博賬號的行為日志并進行分析:統計該行為日志中記錄的調用接口的次數;若統計出的調用接口的次數大于第二閾值,則將該微博賬號的疑似度增加第二步長值。
在所述獲取該微博賬號的行為日志并進行分析時,還包括:
若該行為日志中記錄有登錄、投放廣告記錄,但沒有廣告曝光量的記錄,則將該微博賬號的疑似度增加第三步長值。
在所述將疑似度大于設定值的微博賬號識別為微博營銷賬號之前,還包括:
對于每個微博賬號,分別計算該微博賬號的博文操作行為特征向量到各樣本微博營銷賬號的博文操作行為特征向量的距離,并將計算出的距離的平均值作為第一距離;并分別計算該微博賬號的博文操作行為特征向量到各樣本非微博營銷賬號的博文操作行為特征向量的距離,并將計算出的距離的平均值作為第二距離;若所述第一距離小于所述第二距離,則將該微博賬號劃分成疑似微博營銷賬號;否則,將該微博賬號劃分成非微博營銷賬號;
對于每個劃分成疑似微博營銷賬號的微博賬號,統計該微博賬號的行為日志中關注微博營銷賬號的數量,若統計出的關注微博營銷賬號的數量大于第三閾值,則將該微博賬號的疑似度增加第四步長值。
在所述將疑似度大于設定值的微博賬號識別為微博營銷賬號之前,還包括:
若統計出的登錄時使用的IP地址位于同一網段的微博賬號的數量大于第四閾值,則將登錄時使用的IP地址位于該網段的微博賬號的疑似度增加第五步長值。
在所述將疑似度大于設定值的微博賬號識別為微博營銷賬號之前,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微夢創科網絡科技(中國)有限公司,未經微夢創科網絡科技(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410093704.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種水槽下水管
- 下一篇:數字證書存儲方法、系統以及數字證書讀取方法和系統





