[發明專利]一種基于多馬爾可夫鏈的內容推薦方法有效
| 申請號: | 201010182844.4 | 申請日: | 2010-05-26 |
| 公開(公告)號: | CN101826114A | 公開(公告)日: | 2010-09-08 |
| 發明(設計)人: | 陳振宇;封煜佳;王浩然;劉嘉;吳一帆 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/00 |
| 代理公司: | 南京天翼專利代理有限責任公司 32112 | 代理人: | 黃明哲 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多馬爾可夫鏈 內容 推薦 方法 | ||
技術領域
本發明涉及個性化推薦技術領域,根據用戶的興趣特點、行為以及個人資料向用戶推薦感興趣的商品和信息。個性化推薦基于海量的數據挖掘,常用于電子商務以及社會型網絡應用,可以在龐大的數據中為用戶推薦其所感興趣的信息和商品,減少瀏覽的時間。本發明具體為一種基于馬爾可夫鏈并結合用戶背景信息的內容推薦方法。
背景技術
個性化推薦技術是一個有巨大應用價值的技術。個性化推薦技術近年來不斷的被各種電子商務型網站以及社會型網站所應用,為用戶提供他們所感興趣的信息和商品。個性化推薦技術最早是在1995年被提出來的。此后不斷的被發展應用于電子商務領域,并為電子商務網站帶來了巨大的利益,如亞馬遜。近年來許多的社會型網絡應用也不同程度的使用了推薦系統,比如豆瓣,用以為用戶推薦感興趣的信息。
個性化推薦技術的方法主要包括以下三種:
1)基于關聯規則的推薦算法;
2)基于內容的推薦算法;
3)協同過濾推薦算法。
基于關聯規則的推薦算法,首先挖掘關聯規則形成規則庫,然后為用戶提供相應的推薦項目,但其可擴展性不能滿足需求。
基于內容的推薦算法是定義項目與項目之間的相似度,然后為用戶推薦與其所瀏覽或感興趣過的項目相似的項目。但是這樣的算法在對音樂,電影等很難提取內容的項目時有非常大的難度。并且基于內容的推薦算法只能發現相似的項目,但是無法推薦用戶可能有興趣的其他類項目。
協同過濾推薦算法則是在用戶群中尋找相似的用戶,然后綜合這些相似用戶對某一項目的評價來預測該用戶對這個項目喜好程度。協同過濾算法是一項比較受歡迎的技術。它可以對比較復雜的項目比如音樂、電影進行推薦,同時也能夠保證推薦的新穎性。但是用戶的評價信息有時候非常稀疏,可能導致用戶的相似性并不準確,從而使得所推薦的項目并不為用戶所喜愛。同時協同過濾推薦算法的性能在用戶以及項目數量大幅增加后可能會比較低。
發明內容
本發明要解決的問題是:現有的個性化推薦技術的方法存在不同程度的不足,對于用戶可能感興趣的項目不能做到全面推薦,不能克服推薦算法中的可擴展性問題和稀疏性問題。
本發明的技術方案為:一種基于多馬爾可夫鏈的內容推薦方法,通過網站獲取用戶點擊流數據,以及用戶背景信息,對其進行分析,并生成內容推薦模型;當一個用戶產生新的點擊流時,利用當前的點擊流數據以及內容推薦的模型產生用戶可能感興趣的項目,并推薦給用戶;包括以下步驟:
1)、原始模型建立:建立原始模型,包括每個用戶的馬爾可夫模型,用戶關系矩陣以及用于評價聚類結果好壞的聚類準則函數;
2)、模型學習階段:使模型進行學習,合并相似的馬爾可夫模型,并利用背景相似用戶的點擊數據填充合并后馬爾可夫模型的的零行,也就是缺省信息;
3)、用戶推薦:利用用戶當前的點擊以及所處組別的模型,進行推薦。
本發明步驟具體為:
1)、原始模型建立:
1.1)、記錄并提取每個用戶的點擊流數據,所述點擊流信息是基于控件的點擊流信息;
1.2)、利用點擊流數據對每個用戶建立馬爾可夫模型,包括轉移矩陣A和初始狀態λ,用戶集合G:
轉移矩陣A中,每個頁面X表示模型的一個狀態,Xt表示當前狀態,Xt-1則表示前一刻的狀態,設Pij=(Xt=xj|Xt-1=xi),0<i<n,0<j<n,n為總用戶數,即Pij表示由狀態xi轉移到狀態xj的概率,當A所指向的用戶沒有點擊過頁面Xt時,出現Pt1,Pt2,……Ptn,這一行無法計算,設置為零行,
初始狀態λ=(pi)=(pi2,pi2…pin);
當馬爾可夫模型僅由用戶u1的點擊流數據建立時,用戶集合即為G={u1};
1.3)、從網站注冊用戶的注冊文件中獲得用戶背景信息,包括用戶年齡、性別、學歷、工作、地域,根據這些用戶背景信息來建立用戶關系矩陣,并利用用戶背景信息確定用戶之間的相似性;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010182844.4/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





