[發明專利]融合主題匹配與雙向偏好的個性化事件推薦方法及系統有效
| 申請號: | 202010069262.9 | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111428127B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 錢忠勝;楊家秀;朱懿敏 | 申請(專利權)人: | 江西財經大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9537;G06F16/9536 |
| 代理公司: | 深圳市華騰知識產權代理有限公司 44370 | 代理人: | 彭年才 |
| 地址: | 330000 江西省南*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 融合 主題 匹配 雙向 偏好 個性化 事件 推薦 方法 系統 | ||
1.一種融合主題匹配與雙向偏好的個性化事件推薦方法,其特征在于,包括以下步驟:
步驟一,以文檔主題生成模型LDA提取事件的主題信息,并根據用戶參與的歷史事件記錄得到用戶主題信息,計算新事件和用戶歷史事件的主題,采用JS散度算法計算用戶-事件對的主題匹配度評分;
步驟二,分別構建用戶偏好模型和事件偏好模型,并分別計算用戶偏好評分和事件偏好評分;
步驟三,利用貝葉斯個性化排序算法BPR學習用戶偏好評分和事件偏好評分的權重參數,得到用戶事件雙向偏好評分,將主題匹配度評分和雙向偏好評分線性加權組合得出用戶-事件對的最終推薦評分,向用戶推薦排序后的前K個事件;
其中,步驟一中的所述計算新事件和用戶歷史事件的主題,采用JS散度算法計算用戶-事件對的主題匹配度評分,具體步驟包括:
步驟1-1,將所有事件描述內容組成文檔集
對所有事件內容去除停用詞及標點符號,把去除噪聲干擾詞后的文檔內容視為所有文檔的集合
(1)
給定文檔集,和分別表示文檔的主題分布和詞分布的先驗Dirichlet分布,分別是根據經驗給定的主題先驗分布和詞先驗分布的超參數,
然后使用Gibbs采樣方法估計模型中的兩個未知參數:事件主題分布和主題詞分布;
步驟1-2,根據JS散度算法計算目標用戶歷史事件和新事件之間的主題分布相似度;
根據式(1)已經生成所有事件的主題分布,給定事件和分別具有主題分布,通過JS散度方法首先計算兩者之間的JS散度,如式(2)所示:
(2)
其中,,表示KL散度,用來描述兩個概率分布和之間的差異,計算公式如式(3)所示:
(3)
結合式(2)和式(3)可得事件和的主題相似度為,如式(4)所示:
(4)
其中,事件的主題相似度的值位于[0,1]中,值越接近1則表示事件相似度越高;
步驟1-3,對目標用戶所有歷史事件的相似度取平均值,得到用戶和新事件的主題匹配度評分;
以表示目標用戶的歷史事件數,取目標用戶所有相似度的平均值作為用戶和新事件的主題匹配度評分,如式(5)所示:
(5)
根據構建的主題匹配模型,最終以來度量目標用戶與新事件之間的主題匹配關系。
2.如權利要求1所述的融合主題匹配與雙向偏好的個性化事件推薦方法,其特征在于,步驟一中的所述文檔主題生成模型LDA具有三層生成式貝葉斯網絡結構,包括文檔、主題和詞,其中文檔-主題和主題-詞均服從多項式分布;每個文檔以一定概率選擇一個主題,并從這個主題中以一定概率選擇一個詞語,在任意文檔中的主題均符合Dirichlet分布,通過該分布發掘文本之間的關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江西財經大學,未經江西財經大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010069262.9/1.html,轉載請聲明來源鉆瓜專利網。





