[發明專利]一種契合用戶興趣變化的協同處理方法及系統在審
| 申請號: | 201710414491.8 | 申請日: | 2017-06-05 |
| 公開(公告)號: | CN107368519A | 公開(公告)日: | 2017-11-21 |
| 發明(設計)人: | 黃文明;張健;白善今;張寶軍 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京輕創知識產權代理有限公司11212 | 代理人: | 楊立,周玉婷 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 契合 用戶 興趣 變化 協同 處理 方法 系統 | ||
技術領域
本發明涉及信息處理領域,具體涉及一種契合用戶興趣變化的協同處理 方法及系統。
背景技術
隨著計算機網絡的飛速發展,現在我們身處于一個信息數據爆炸式增長 的世界網絡每天都有巨量的數據進行交換和分享。諸如在線內容服務、即時 通信、社交網絡和云計算等新興的網絡信息服務在今天的日常生活中扮演著 極其重要的角色。面對琳瑯滿目的應用產生的海量信息,用戶需要根據自身 需求投入大量的精力和時間在過濾和篩選這些網絡應用提供的信息數據當 中。
隨著時間的推移,推薦系統目前逐漸成為機器學習、數據挖掘以及人機 接口相關領域的熱門研究方向,如美國明尼蘇達大學的GroupLens團隊、美 國密歇根大學Paul Resnick教授帶領的團隊、微軟研究院等很多研究團隊 都對推薦系統及其算法進行了很多基礎研究和改進工作?,F在推薦系統得到 了長足的進步,大量的研究在解決推薦算法存在的各種問題上取得了不少成 果。但是研究主要集中在解決推薦算法存在的可擴展性問題、系統冷啟動問 題等方面。隨著網絡世界翻天覆地的變化和各項技術日益的創新,用戶的需 求也越來越高,如何解決當前推薦系統對于個性化推薦能力的欠缺,是當前 業界關注的重點之一。因此,個性化推薦系統中存在的用戶隱性喜好的發現、 用戶的興趣漂移、推薦的時效性都是現在研究的主要方向。
在個性化推薦系統中,由于用戶興趣的多樣性和動態性,導致在交互過 程中很難明確用戶的主觀興趣,即存在著用戶興趣的潛在性。而當前有關用 戶興趣變化的協同過濾算法往往是直接簡單地基于數據集中的用戶歷史行 為數據來計算得到用戶之間的相似度。由此帶來了許多造成推薦系統準確度 降低的問題,例如:由矩陣表示的數據集存在著稀疏性帶來的數據稀疏性問 題、推薦不能反映用戶興趣動態的變化帶來的用戶興趣漂移問題等。
發明內容
本發明所要解決的技術問題是針對現有技術的不足,提供一種契合用戶 興趣變化的協同處理方法及系統。
本發明解決上述技術問題的技術方案如下:一種契合用戶興趣變化的協 同處理方法,包括如下步驟:
采集用戶數據并格式化,得到用戶行為數據集,所述用戶行為數據集包 括用戶對項目評分和用戶對項目的行為時間信息;
根據所述用戶行為數據集構建項目顯式主題向量,并對所述項目顯式主 題向量進行相似度計算,得到目標項目的近鄰列表;
根據艾賓浩斯遺忘曲線方法以及所述用戶對項目的行為時間信息更新所 述用戶對項目評分,得到新的用戶對項目評分;
根據所述用戶行為數據集構建用戶興趣主題向量,并根據所述用戶興趣 主題向量構建用戶畫像personas,并根據所述新的用戶對項目評分更新所述 用戶畫像personas;
根據更新后的用戶畫像personas進行相似度計算,得到目標用戶的近鄰 列表;
根據所述目標用戶的近鄰列表和目標項目的近鄰列表,得到目標用戶及 其近鄰用戶對目標項目的項目列表;以及
對所述目標用戶及其近鄰用戶對目標項目的項目列表進行平均值計算, 得到目標用戶對目標項目的預測評分,將所述預測評分作為推薦結果。
本發明的有益效果是:通過用戶對項目的行為時間信息更新用戶對項目 的評分,考慮了用戶行為的時序性對其興趣的影響,解決了現有技術中存在 的概念漂移問題,另外,基于更新后的用戶興趣向量和用戶畫像,對項目進 行評分預測,對數據具有更好的抗稀疏性。
在上述技術方案的基礎上,本發明還可以做如下改進。
進一步,所述得到目標用戶及其近鄰用戶對目標項目的項目列表后,還 包括步驟:
根據貝葉斯重排序算法對所述目標用戶及其近鄰用戶對目標項目的項 目列表進行重新排序。
采用上述進一步方案的有益效果是:使用貝葉斯重排序進行重排序,增 強了全局穩定性,貝葉斯重排序是在重排序的過程合理運用概率論的相關知 識,把重排序列表和文本搜索列表之間的排序一致性約束視為兩者的似然 性,把主題信息相似的樣本的排序一致性約束視為條件先驗,其最終目的是 最大化條件先驗和似然性的乘積。
進一步,所述得到目標用戶對目標項目的預測評分后,還包括步驟:
根據Top-K算法對所述預測評分進行篩選,從而將篩選過的預測評分作 為推薦結果。
采用上述進一步方案的有益效果是:Top-K算法能夠篩選出排列在前的 優選結果,提高推薦結果的可靠性。
進一步,所述得到目標用戶及其近鄰用戶對目標項目的項目列表,具體 方法為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710414491.8/2.html,轉載請聲明來源鉆瓜專利網。





