[發明專利]一種主題相關的影響力用戶發現和追蹤方法有效
| 申請號: | 201710488321.4 | 申請日: | 2017-06-23 |
| 公開(公告)號: | CN107145612B | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 蘇森;張忠寶;王亞坤;常誠 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06Q50/00 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 李莎;李弘 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 主題 相關 影響力 用戶 發現 追蹤 方法 | ||
本發明公開了一種主題相關的影響力用戶發現和追蹤方法,通過結合考慮時間因素以及主題相關性的手段,適應影響力隨時間的動態變化,并且通過調控數據流的大小,能夠獲得具有不同時間粒度的結果,能夠通過離線或在線的方式全面而準確地發現和追蹤有影響力的用戶,更精確地反映用戶的影響力變化,克服了僅僅利用累計鏈接找到過時的影響力用戶的技術缺陷,能夠得出用戶影響力的動態變化及趨勢,并進行實時跟蹤。
技術領域
本發明涉及機器學習技術領域,特別是指一種主題相關的影響力用戶發現和追蹤方法。
背景技術
近年來,社交媒體發展迅速,許多商業應用(如廣告、推薦)在社交媒體平臺大量涌現。在社交媒體中,用戶的影響力可以影響他人的觀點和行為。因此,如何充分利用用戶的影響力來提升商業應用的效果,成為了急需解決的技術問題。
通常,人們想要找到的是當下有影響力的用戶,而影響力會隨著時間推移動態變化,為了更準確地衡量用戶的影響力,除了利用鏈接的數量,如何利用鏈接生成的時間來捕捉影響力的動態變化趨勢也極其重要。然而現有技術中,例如現有技術中的Link-LDA方法和FLDA方法,通常只利用累積的鏈接數,如用戶的粉絲數,來衡量用戶在不同主題上的影響力,以至于他們通常會找到那些影響力已經過時的用戶。
發明內容
有鑒于此,本發明的目的在于提出一種主題相關的影響力用戶發現和追蹤方法,能夠發現和追蹤社交媒體中主題相關的當下最具有影響力的用戶,優化廣告和推薦的應用。
基于上述目的本發明提供的一種主題相關的影響力用戶發現和追蹤方法,包括:
建立TIT模型:獲取用戶的目標社交媒體中的文本數據、鏈接以及鏈接生成的時間數據,并建立所述TIT模型;
確定隱含參數:利用吉布斯抽樣,確定所述TIT模型中的隱含參數;其中,所述隱含參數包括用戶在主題上的多項式分布θ、主題在單詞上的多項式分布用戶在二元指示符y上的伯努利分布μ,主題在鏈接f和鏈接生成時間t上的多項式分布σ,以及主題無關的用戶影響力的多項式分布π;
分析用戶主題相關影響力分布:通過所述隱含參數和模型參數,得到不同時間在不同主題下的用戶主題相關影響力分布σ,得出用戶主題相關影響力隨時間的變化,從而得出當前時刻或之前任意時刻的用戶主題相關影響力;其中,所述模型參數包括:α、β、γ、ε和ρ,其中α、β、γ、ε分別為θ、σ、π的狄利克雷分布的超參數,ρ為μ的貝塔分布的超參數。
可選地,所述TIT模型包括用戶-鏈接-時間模塊和用戶-單詞模塊;
所述用戶-鏈接-時間模塊對用戶u的鏈接f以及鏈接生成的時間t進行建模,將鏈接f生成時間t到當前時刻的時間段分成T'個時間片,其中u表示第u個用戶,u∈[1,U],U為用戶的數量,同時,將整個鏈接網絡當做一個文檔,在該文檔中,鏈接f和鏈接的生成時間t的組合(f,t)被作為該文檔的單詞;所述用戶-鏈接-時間模塊包含一個上層的伯努利混合模型μ、一個下層的多項式混合模型σ以及一個下層的多項式混合模型π,其中,μ用來判斷f的生成是否是基于用戶u的主題興趣,通過μ生成二元指示符y,若y=1,即f的生成是基于用戶u的主題興趣,則利用用戶u的主題x在(f,t)上的多項式分布σ來生成(f,t);若y=0,即f的生成并非基于用戶u的主題興趣,則利用全局的多項式分布π來生成(f,t);
所述用戶-單詞模塊對用戶的目標社交媒體內容進行建模,將各個用戶的目標社交媒體內容分別整合為一個文檔,并對整合后的所有文檔利用LDA主題模型來發現用戶潛在的主題,從而得到用戶在主題上的多項式分布θ,以及主題在單詞上的多項式分布
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710488321.4/2.html,轉載請聲明來源鉆瓜專利網。





