[發明專利]一種用于跨UGC網站平臺的帳戶關聯方法有效
| 申請號: | 201510032702.2 | 申請日: | 2015-01-22 |
| 公開(公告)號: | CN104573057B | 公開(公告)日: | 2017-10-27 |
| 發明(設計)人: | 羅緒成;陳偉;劉夢娟;劉嶠;藍天;劉亞軍;湯四見;趙鵬;李偉銘 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 ugc 網站 平臺 帳戶 關聯 方法 | ||
技術領域
本發明屬于互聯網賬戶分析領域,更為具體地講,涉及一種用于跨UGC網站平臺的針對屬于同一實體用戶的多帳戶關聯方法。
背景技術
UGC(User Generated Content)網站主要是指基于用戶生成內容的在線社交網站和在線論壇等,目前比較著名的UGC網站有Facebook、Twitter、Google+、人人網、開心網、豆瓣、新浪微博、騰訊微博等,它們已經成為主流分享信息的網絡平臺。然而,各種UGC網站提供給網民的服務類別不同,例如Facebook、Google+、人人網主要為用戶提供社交服務,Twitter、新浪微博、騰訊微博允許用戶將自己的最新動態和想法分享出來,淘寶網、京東商城則主要用于電子商務。因此,在不同類別的網絡中我們獲取到的信息會有所不同,將某種類別UGC網站的用戶行為信息通過分析處理后應用到另外一種類別的UGC網站中去,可能會收獲意想不到的效果,例如我們可以將Facebook、Google+、Twitter、人人網、大眾點評網這種含有社交屬性網站的用戶行為信息經過分析處理后應用到淘寶網、京東商城這種沒有社交屬性的電子商務類別的網站中,可以迅速提高網站的服務質量、商品推薦質量等。由于目前各UGC網站用戶帳戶之間信息相互獨立,因此,對屬于同一實體用戶的跨UGC網站用戶賬戶進行關聯具有重要意義和價值。
同時,隨著UGC網站迅速發展,有些人利用UGC網站平臺發布虛假信息、散播不實言論等,來達到自己不可告人的目的。這些人主要通過匿名的方式在多個UGC網站帳戶上發布消息。這些惡意行為被稱為“跨網站帳戶攻擊”,這種現象對UGC網站平臺的后臺管理帶來了嚴重的困擾,在UGC網站后臺的存儲、計算、傳輸、應用等方面都帶來了額外的開銷,妨礙了網絡資源的合理應用,嚴重影響了UGC網站平臺的性能,因此,對屬于同一實體用戶的跨UGC網站多帳戶進行關聯更加具有研究價值。
在對用戶帳戶建模方面,傳統的賬戶關聯的研究中,一部分研究通過從用戶在使用UGC網站時發生的行為中抽取特征對用戶帳戶進行建模,這些傳統研究中定義的用戶特征包括用戶使用UGC網站時進行的行為操作,包括鼠標停留時間、頁面訪問頻次、檢索詞使用習慣等。在獲得UGC網站訪問量基本數據的情況下,對有關數據進行統計、分析,從中發現用戶訪問UGC網站的規律,從而對用戶帳戶進行建模,關聯網站用戶賬戶。但是,這些用戶特征在UGC網站中一般不容易獲取,且UGC網站服務器所統計相關數據與用戶的真實行為誤差比較大,因此帳戶關聯準確率比較低。另一部分研究通過從用戶帳戶名字,出生日期,教育背景等用戶在注冊UGC網站時所公布的個人信息中提取特征對用戶帳戶建模,從而實現用戶帳戶關聯;然而,在UGC網站中,用戶帳戶所公布個人信息涉及用戶的個人隱私,往往不真實、不全面,且隨機性比較高,因此,使用此方法的準確性和健壯性均不高。
UGC逐漸成為社交網站用戶互動的主要應用形式,用戶經常把與自身相關的信息以UGC的形式在網站上發布,Facebook、Twitter、人人網、大眾點評網等網站都可以看作是UGC的成功案例,社區網絡、視頻分享、博客和播客(視頻分享)等都是UGC的主要應用形式。本發明在對用戶帳戶進行建模時所使用的用戶特征與傳統研究中定義的用戶特征不同,主要針對用戶在使用UGC網站時所生成的文本內容中提取用戶特征,從而對用戶帳戶進行建模,實現對屬于同一實體用戶的跨UGC網站多帳戶關聯。在UGC網站中,可以從用戶的文本內容中提取多個特征,例如,地理位置活動特征、寫作風格特征等,對用戶帳戶進行建模,能夠比較全面的表達出用戶的特點,從而獲得較高的用戶帳戶關聯準確率。同時,用戶生成的文本內容比較穩定,不易被修改,具有較高的健壯性。
在跨UGC網站用戶帳戶關聯方法選取方面,傳統的研究大部分采用單特征關聯方法,即針對每個用戶特征,對用戶帳戶進行關聯一次,沒有將多個用戶特征組合起來對跨UGC網站多賬戶進行關聯,因而得到的關聯用戶賬戶準確率比較低。與以往研究不同,本發明采用逐層過濾的方法對用戶帳戶進行關聯,即依次利用用戶帳戶模型中的多個用戶特征對目標用戶帳戶數據集進行篩選,逐步縮小候選集,最終獲得的用戶賬戶數據集即是相互關聯的跨UGC網站的多個用戶帳戶。由于充分利用了用戶賬戶模型的各個特征,采用逐層過濾方法對跨UGC網站的多個用戶賬戶進行關聯具有較高的準確率。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510032702.2/2.html,轉載請聲明來源鉆瓜專利網。





