[發明專利]移動社交網絡中基于時空行為模式的用戶興趣模型構建方法有效
| 申請號: | 201510695412.6 | 申請日: | 2015-10-23 |
| 公開(公告)號: | CN105373591B | 公開(公告)日: | 2019-05-14 |
| 發明(設計)人: | 蔣昌俊;閆春鋼;程久軍 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06Q50/00;G06K9/62 |
| 代理公司: | 上海科律專利代理事務所(特殊普通合伙) 31290 | 代理人: | 葉鳳 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 移動 社交 網絡 基于 時空 行為 模式 用戶 興趣 模型 構建 方法 | ||
1.一種移動社交網絡中基于時空行為模式的用戶興趣模型構建方法,其特征在于,包括如下步驟:
首先,通過模型初始化算法處理用戶在移動社交網絡環境中不同時空行為模式下的歷史數據,得到初始用戶興趣模型,訓練過程中可能缺少某些時空行為模式下用戶對主題的行為數據,從而模型中存在空缺項;
模型初始化就是分析用戶在移動社交網絡環境中不同時空行為模式下的歷史數據,得到初始用戶興趣模型,記作UPMi,用于計算用戶在不同時空行為模式下對主題的興趣度;
在用戶時空行為模式ck下,第i個用戶ui的行為數據表現為一條條微博內容,首先需要將一條條微博進行整合,用于解決短文本特征詞獲取困難問題,ck表示從時間和空間兩個維度描述用戶所處情景信息的一種行為模式;以上,1≤k≤c,1≤i≤m,k表示用戶行為模式的數量,c表示所有用戶時空行為模式的數量,m是所有用戶的數量;整合之后通過分詞,去停用詞,計算詞頻,nt 表示詞語t在微博中出現的次數,nw表示微博所有詞語的個數;微博內容表示為向量Wik=((f1,tf1),(f2,tf2),...,(fn,tfn)),fp表示第p個特征詞,tfp表示詞頻,1≤p≤n;
這樣用戶ui在時空行為模式ck下對主題sj的興趣度計算采用式(1),
其中,P(sj)表示主題sj出現的概率,1≤j≤n,n表示所有主題的數量,計算時為主題類別cj中微博數量除以總數量,P(Wik)表示微博Wik出現的概率,計算時每個微博出現的概率均相等,P(fp|sj)表示特征詞fp在主題sj中出現的概率,就是特征詞fp在主題類別cj的概率,即wi;
接著,通過用戶-主題興趣矩陣分別計算用戶與用戶之間、主題與主題之間的相似性,獲得用戶和主題的相似性集合;
然后,對用戶主題相似性集合分別進行相似近鄰計算,選擇相似用戶和相似主題;
最后,根據選擇的相似近鄰的興趣度計算用戶興趣模型中的空缺項;
用戶ui在行為模式ck下對主題sj的興趣度采用式(11)計算:
其中,分別是采用User-based和Item-based的協同過濾方法計算的用戶ui在行為模式ck下對主題sj的興趣度,分別根據式(9)和(10)計算,λ∈(0,1)根據實驗調整;
公式(9)為:
其中α∈(1,0)為調節系數,由實驗確定,Rojk表示用戶uo在行為模式ck下對主題sj的興趣度,SIMU(ui,uo)表示用戶ui,uo的相似性,KNBU(ui)表示用戶ui的相似用戶集合,UI(uo)表示用戶uo重要度;
公式(10)為:
其中Riok表示用戶ui在行為模式ck下對主題so的興趣度,SIMS(sj,so)表示主題sj,so的相似性,KNBS(sj)表示主題sj的相似主題集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510695412.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種展示網頁中目標元素的方法及裝置
- 下一篇:知識數據的處理方法及裝置





