[發明專利]基于長短時記憶網絡的群組劃分方法及系統有效
| 申請號: | 202110182959.1 | 申請日: | 2021-02-08 |
| 公開(公告)號: | CN112990430B | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 梅紅巖;許曉明;劉鑫;李凱 | 申請(專利權)人: | 遼寧工業大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京鴻元知識產權代理有限公司 11327 | 代理人: | 袁文婷;張娓娓 |
| 地址: | 121001 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 短時記憶 網絡 劃分 方法 系統 | ||
1.一種基于長短時記憶網絡的群組劃分方法,其特征在于,包括:
根據用戶歷史行為信息進行時序性建模,以形成時序性數據序列;
通過預設的長短時記憶網絡模型對所述時序性數據序列進行特征提取,以獲取用戶隨時間遷移的行為特征信息,并根據所述用戶隨時間遷移的行為特征信息確定用戶隱式相似度;
根據用戶顯式相似度和所述用戶隱式相似度對用戶進行群組劃分;
其中,所述根據用戶歷史行為信息進行時序性建模的方法包括:
將所述用戶歷史行為信息按時間排序,形成用戶初始行為序列H.用戶a的用戶初始行為序列Ha;
分別計算每一個用戶初始行為序列的長度,取所述長度的中位數作為閾值z,定義時間間隔t=T/z,對每個用戶,選取每一小段時間間隔t中第一個行為信息為所述時間間隔t的歷史行為信息,其中,若某個時間間隔內沒有行為信息,則定義離所述沒有行為信息的時間間隔最近的原始序列中的歷史行為信息為所述沒有行為信息的時間間隔的歷史行為信息,最終得到時間長度T一致且每個時間間隔都有行為信息的用戶行為序列HT;
所述用戶顯式相似度通過如下步驟計算獲取:
首先,計算用戶相似度,其中,將用戶評分矩陣看作空間上的向量,通過所述用戶評分矩陣余弦夾角值來表示用戶之間的相似度,夾角越小,余弦值越大,用戶相似度越高,用戶u和v之間的相似度Sim_out(u,v)計算公式為:
其中:Rui、Rvi分別表示用戶u、用戶v對項目i的評分,Iu、Iv分別表示用戶u和用戶v的所有評分項目集;
其次,通過計算項目類型的偏好程度來推測用戶對項目的偏好程度,其中,用戶u對項目i的偏好程度計算公式為:
Wui=Rui×W_tag(ui,T);
其中,T為項目i所有類別的興趣度列表,W_tag(ui,T)表示用戶u對項目i的感興趣程度,計算公式為:
其中,Tx表示第x個屬性的興趣度,表示x屬性的值tx出現的次數,Countt代表用戶所有評分的帶有t數據的項目數;
用戶的偏好相似度的計算公式如下:
最后,計算用戶顯式相似度Sim(u,v),計算公式為:
Sim(u,v)=α×Sim_out(u,v)+β×Sim_intest(u,v)+(1-α-β)×Sim_out(u,v)×Sim_intest(u,v);
其中,α和β是權重值,取值0~1。
2.如權利要求1所述的基于長短時記憶網絡的群組劃分方法,其特征在于,在所述根據用戶歷史行為信息進行時序性建模之前,還包括數據清洗步驟:
對包含用戶的歷史活動信息的基礎數據集進行數據清洗,以提取多維度的用戶歷史行為信息。
3.如權利要求2所述的基于長短時記憶網絡的群組劃分方法,其特征在于,所述用戶歷史行為信息包括用戶畫像、項目的內容、項目的評分。
4.如權利要求3所述的基于長短時記憶網絡的群組劃分方法,其特征在于,
將所述用戶歷史行為信息按時間排序,形成的用戶初始行為序列H.用戶a的用戶初始行為序列Ha為Ha=[p1a,p2a,p3a,p4a,p5a,…,pna];
其中pna表示用戶a的第n個行為信息,包括用戶評分、項目名、項目類型;
時間長度T一致且每個時間間隔都有行為信息的用戶行為序列HT:
HT=[pta,pt2,pt3,…,ptn];
其中ptn表示某用戶的第n個時間間隔內的行為信息,包括用戶評分、項目名、項目類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遼寧工業大學,未經遼寧工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110182959.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全耗能連接型柔性棚洞系統及其設計方法
- 下一篇:一種激光焊接工裝





