[發明專利]一種主題相關的影響力用戶發現和追蹤方法有效
| 申請號: | 201710488321.4 | 申請日: | 2017-06-23 |
| 公開(公告)號: | CN107145612B | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 蘇森;張忠寶;王亞坤;常誠 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06Q50/00 |
| 代理公司: | 北京風雅頌專利代理有限公司 11403 | 代理人: | 李莎;李弘 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 主題 相關 影響力 用戶 發現 追蹤 方法 | ||
1.一種主題相關的影響力用戶發現和追蹤方法,其特征在于,包括:
建立TIT模型:獲取用戶的目標社交媒體中的文本數據、鏈接以及鏈接生成的時間數據,并建立所述TIT模型;
確定隱含參數:利用吉布斯抽樣,確定所述TIT模型中的隱含參數;其中,所述隱含參數包括用戶在主題上的多項式分布θ、主題在單詞上的多項式分布用戶在二元指示符y上的伯努利分布μ,主題在鏈接f和鏈接生成時間t上的多項式分布σ,以及主題無關的用戶影響力的多項式分布π;
分析用戶主題相關影響力分布:通過所述隱含參數和模型參數,得到不同時間在不同主題下的用戶主題相關影響力分布σ,得出用戶主題相關影響力隨時間的變化,從而得出當前時刻或之前任意時刻的用戶主題相關影響力;其中,所述模型參數包括:α、β、γ、ε和ρ,其中α、β、γ、ε分別為θ、σ、π的狄利克雷分布的超參數,ρ為μ的貝塔分布的超參數。
2.根據權利要求1所述的一種主題相關的影響力用戶發現和追蹤方法,其特征在于,所述TIT模型包括用戶-鏈接-時間模塊和用戶-單詞模塊;
所述用戶-鏈接-時間模塊對用戶u的鏈接f以及鏈接生成的時間t進行建模,將鏈接f生成時間t到當前時刻的時間段分成T'個時間片,其中u表示第u個用戶,u∈[1,U],U為用戶的數量,同時,將整個鏈接網絡當做一個文檔,在該文檔中,鏈接f和鏈接的生成時間t的組合(f,t)被作為該文檔的單詞;所述用戶-鏈接-時間模塊包含一個上層的伯努利混合模型μ、一個下層的多項式混合模型σ以及一個下層的多項式混合模型π,其中,μ用來判斷f的生成是否是基于用戶u的主題興趣,通過μ生成二元指示符y,若y=1,即f的生成是基于用戶u的主題興趣,則利用用戶u的主題x在(f,t)上的多項式分布σ來生成(f,t);若y=0,即f的生成并非基于用戶u的主題興趣,則利用全局的多項式分布π來生成(f,t);
所述用戶-單詞模塊對用戶的目標社交媒體內容進行建模,將各個用戶的目標社交媒體內容分別整合為一個文檔,并對整合后的所有文檔利用LDA主題模型來發現用戶潛在的主題,從而得到用戶在主題上的多項式分布θ,以及主題在單詞上的多項式分布
3.根據權利要求1所述的一種主題相關的影響力用戶發現和追蹤方法,其特征在于,所述TIT模型的生成過程為:利用用戶u的主題分布θu,生成一個單詞分布主題zu,m,利用單詞分布主題zu,m在單詞上的分布生成單詞wu,m;同時,利用用戶u的伯努利分布μu生成二元指示符yu,l,確定用戶u在時刻tu,l生成的鏈接fu,l是否是基于用戶u的主題興趣,若yu,l=1,則從用戶u的主題分布θu中生成一個鏈接分布主題xu,l,并利用主題-鏈接-時間多項式分布σu,l生成fu,l和tu,l;若yu,l=0,則利用與主題無關的全局的多項式分布π生成fu,l和tu,l;其中,u表示第u個用戶,u∈[1,U],U為用戶的數量,m表示用戶u的第m個單詞,m∈[1,Nu],Nu為用戶u的單詞數量,l表示用戶u的第l個鏈接,l∈[1,Lu],Lu為用戶u的鏈接數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710488321.4/1.html,轉載請聲明來源鉆瓜專利網。





