[發明專利]基于概率模型和用戶行為分析的個性化推薦方法、系統在審
| 申請號: | 201610127077.4 | 申請日: | 2016-03-07 |
| 公開(公告)號: | CN105574216A | 公開(公告)日: | 2016-05-11 |
| 發明(設計)人: | 于敬;陳運文;桂洪冠;紀傳俊;張健 | 申請(專利權)人: | 達而觀信息科技(上海)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京卓唐知識產權代理有限公司 11541 | 代理人: | 龔潔 |
| 地址: | 200000 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 概率 模型 用戶 行為 分析 個性化 推薦 方法 系統 | ||
技術領域
本發明涉及計算機數據處理技術領域,特別涉及基于概率模型和用戶行為分析的 個性化推薦方法、系統。
背景技術
隨著互聯網信息技術的發展,尤其是電子商務的興起,互聯網內容呈現爆炸式的 增長,人們逐漸進入海量數據時代。每天面對琳瑯滿目并且種類繁雜的商品、電影、歌曲、視 頻等各種服務時,卻無所適從,這就是經常提到的信息過載(informationoverload)問題。 同時,互聯網上的各種物品又存在長尾(longtail)現象,指大部分商品屬于冷門而沒有展 示的機會。ChrisAnderson在2006年出版的《長尾理論》一書中指出,傳統的80/20原則 (80%的銷售額來自于20%的熱門品牌)在互聯網時代下回面臨更多挑戰。主流的商品基本 上代表的是大部分用戶的需求,但是長尾的商品代表的則是一小部分個性化需求。應對信 息過載和長尾物品的問題,推薦系統大顯身手。能夠根據用戶的歷史行為數據,對用戶進行 興趣建模,推薦用戶感興趣的物品(如商品、電影、新聞),這就是個性化推薦系統。
目前,個性化推薦系統能夠在用戶沒有明確目的時候,幫助發現那些他們感興趣 但很難發現的物品。但是也存在諸多難點。
1、用戶興趣的量化。正所謂:一千個人中有一千個漢姆雷特。個人的興趣千差萬 別,如何給出一種能準確量化用戶興趣的指標,用以表征用戶的偏好。比如如何判斷用戶喜 歡娛樂八卦的文章還是喜歡時事政治,如何量化對各個類別、標簽的偏好程度。
2、用戶行為模式挖掘。用戶歷史行為數據代表了用戶的明確需求,每一次的鼠標 點擊都是用戶本質需求的反應。基于用戶的注冊、登錄、瀏覽、點擊、購買、收藏、打分、評論 等各種維度的數據中,如何提取有價值的用戶屬性。
3、個性化的精準性。如何保證個性化的推薦結果是真正符合用戶需求,一直也都 是業界都在絞盡腦汁解決的問題。
發明內容
本發明要解決的技術問題是,通過將原始數據進行預處理后,構建用戶模型,用以 準確刻畫用戶的興趣點和本質的信息獲取需求,以提供精準的個性化推薦,從而解決互聯 網中的信息過載和長尾物品的問題。
解決上述技術問題,本發明提供了基于概率模型和用戶行為分析的個性化推薦方 法,包括如下步驟:
提取得到物品以及物品屬性信息,且提取得到用戶對物品的操作行為;所述物品 是在不同場景下,待推薦主體;所述操作行為是用戶在不同場景下,所包含的操作類型;
通過所述物品屬性信息和用戶對物品的操作行為,得到興趣點;通過用戶對物品 的操作行為,獲取用戶興趣相似度,并得到相似用戶;根據用戶對物品基于時間維度的操作 行為,得到衰減因子;根據所述興趣點、相似用戶、衰減因子建立用戶模型;
根據用戶模型,得到用戶在各個維度的興趣特征信息;
對所述興趣特征信息進行過濾,并采用推薦算法生成待推薦結果;
根據所述待推薦結果進行算法融合,得到用戶個性化推薦的結果。
更進一步,所述物品以及物品屬性信息為:
<itemid,publisher,categroyid,tagid>
其中itemid表示唯一標識一個物品,publisher表示物品的發布者,categoryid表 示物品所屬的類別id,tagid表示物品的標簽id。
更進一步,所述用戶對物品的操作行為為:
<userid,itemid,timestamp,action_type>
其中userid表示唯一標識一個用戶,itemid表示唯一標識一個物品,timestamp表 示本次操作的時間,action_type表示本次操作的類型;所述用戶對物品的操作行為包括, 用戶的歷史行為數據。
更進一步,通過所述物品屬性信息和用戶對物品的操作行為,得到興趣點的方法 為:
4-1)遍歷用戶所有點擊過的itemid,獲取itemid對應的categoryid,統計每一個 用戶點擊行為下的每個類別的點擊次數,這樣就得到了每個用戶點擊過的類別次數分布;
4-2)計算點擊過的各個物品的類別概率分布即為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于達而觀信息科技(上海)有限公司,未經達而觀信息科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610127077.4/2.html,轉載請聲明來源鉆瓜專利網。





