[發明專利]一種用于興趣點推薦的獲取時間偏好融合序列偏好的方法有效
| 申請號: | 202110002497.0 | 申請日: | 2021-01-04 |
| 公開(公告)號: | CN112765493B | 公開(公告)日: | 2022-07-05 |
| 發明(設計)人: | 彭蓉;李松 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/9537 | 分類號: | G06F16/9537;G06F16/9535;G06K9/62 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 許蓮英 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 興趣 推薦 獲取 時間 偏好 融合 序列 方法 | ||
1.一種用于興趣點推薦的獲取時間偏好融合序列偏好的方法,其特征在于,包括以下步驟:
步驟1:數據預處理,得到興趣點的特征時間戳,初始化興趣點的嵌入向量、時間戳差值的嵌入向量,得到用戶的正、負樣本興趣點嵌入向量序列和其對應的簽到時間戳差值嵌入向量序列;
步驟2:將單個用戶的簽到序列作為一批數據進行訓練,將興趣點嵌入向量、時間戳差值嵌入向量融入GRU模型;
步驟3:構建用戶的嵌入向量,計算用戶對興趣點的序列偏好以及用戶對興趣點的時間偏好;
步驟4:將用戶對興趣點的序列偏好以及用戶對興趣點的時間偏好進行融合,得到用戶對興趣點的融合偏好值;
步驟5:利用用戶對正樣本興趣點的融合偏好值和負樣本興趣點融合偏好值,進一步構造損失函數,計算loss值;
步驟6:優化后的網絡模型使用;
所述步驟1具體包括以下步驟
步驟1.1:對用戶的簽到時間進行編碼得到用戶的簽到時間戳;
考慮到用戶在工作日和周末的興趣點偏好不同,但在不同工作日之間、不同周末時間的興趣點偏好較為穩定;
根據簽到時間屬于周末和工作日將其分為多個時間區間,通過如下公式對簽到時間戳進行編碼:
其中,tx表示簽到的時間點,其中x∈[1,N],N表示用戶u的簽到序列長度,Δt表示設定的時間戳之間的最小時間間隔,Tt設為定值48,1≤Tt≤24個間隔代表工作日,24≤Tt≤48個間隔代表周末,表示總的時間間隔數,h,m,s分別表示時間點tx中對應的小時、分鐘和秒,表示簽到時間為工作日,tx∈{sat,sun}表示簽到時間為周末;表示用戶u在時間點tx的簽到時間戳;
步驟1.2:計算興趣點的特征時間戳;
對于興趣點集合P={p1,p2,...,pm}中的m個興趣點來自于所有用戶的簽到記錄,也就是說,并不是所有興趣點都被每一個用戶訪問過,而且就算被用戶訪問過,一次訪問行為也反映不了用戶訪問地點的時間規律,需要一個能代表地點被用戶訪問的特征時間戳用于獲取用戶的負樣本簽到記錄;
計算興趣點集合中第x個興趣點px的特征時間戳,其中x∈[1,m]:
其中,表示興趣點集合中第x個興趣點px的特征時間戳,表示興趣點px在時間戳的值時被所有用戶訪問的總次數,其中y∈[0,t-1];|Cu|表示用戶u的簽到次數,表示用戶u在其簽到序列中第j個興趣點的簽到時間戳,表示用戶u在其簽到序列中的第j個簽到興趣點;
表示興趣點px所有被訪問時間戳的次數中選出的最大值,其中z∈[0,t-1];
Sz即為興趣點px的特征時間戳的具體值;
興趣點集合為:P={p1,p2,...,pm}所對應的特征時間戳為
步驟1.3:初始化用戶的簽到序列中興趣點的嵌入向量、時間戳差值的嵌入向量,得到用戶的正、負樣本興趣點嵌入向量序列和其對應的簽到時間戳差值嵌入向量序列;
簽到的興趣點即p可以用嵌入向量進行表示,用均勻分布進行初始化;則表示用戶u在t時刻的興趣點嵌入向量;
時間戳差值Δt用一個d維的向量表示,其中同樣使用均勻分布進行初始化;則表示用戶u在ti+1和ti時刻之間的時間戳差值嵌入向量;
得到用戶的正樣本興趣點嵌入向量序列和其對應的簽到時間戳差值嵌入向量序列:
對于用戶u的正樣本簽到序列,定義為:
正樣本簽到序列Cu中的正樣本興趣點嵌入向量序列為:
計算出Cu對應的正樣本簽到時間戳序列:
對于任意的兩個時間戳,它們的差值會在{0,Δt,2Δt,...,(St-1)Δt}中取值,相應的可以得到一個時間戳差值序列其中
用戶的正樣本簽到時間戳序列tu所對應的正樣本簽到時間戳差值嵌入向量序列為:
得到用戶的負樣本興趣點嵌入向量序列和其對應的簽到時間戳差值嵌入向量序列:
對于用戶u的簽到的負樣本簽到序列是從P={p1,p2,...,pm}中隨機選擇第u個用戶未訪問過的地點px,及取出px對應的特征時間戳得來;
對于用戶u的負樣本簽到序列所對應的負樣本興趣點嵌入向量序列為:
利用步驟1.3中的計算結果,取出中每一個負樣本興趣點所對應特征時間戳,最終構成負樣本簽到時間戳序列:
同樣,用戶的負樣本簽到時間戳序列所對應的負樣本簽到時間戳差值嵌入向量序列為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110002497.0/1.html,轉載請聲明來源鉆瓜專利網。





