[發明專利]一種基于多馬爾可夫鏈的內容推薦方法有效
| 申請號: | 201010182844.4 | 申請日: | 2010-05-26 |
| 公開(公告)號: | CN101826114A | 公開(公告)日: | 2010-09-08 |
| 發明(設計)人: | 陳振宇;封煜佳;王浩然;劉嘉;吳一帆 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/00 |
| 代理公司: | 南京天翼專利代理有限責任公司 32112 | 代理人: | 黃明哲 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 多馬爾可夫鏈 內容 推薦 方法 | ||
1.一種基于多馬爾可夫鏈的內容推薦方法,其特征是通過網站獲取用戶點擊流數據,以及用戶背景信息,對其進行分析,并生成內容推薦模型;當一個用戶產生新的點擊流時,利用當前的點擊流數據以及內容推薦的模型產生用戶可能感興趣的項目,并推薦給用戶;包括以下步驟:
1)、原始模型建立:建立原始模型,包括每個用戶的馬爾可夫模型,用戶關系矩陣以及用于評價聚類結果好壞的聚類準則函數;
2)、模型學習階段:使模型進行學習,合并相似的馬爾可夫模型,并利用背景相似用戶的點擊數據填充合并后馬爾可夫模型的的零行,也就是缺省信息;
3)、用戶推薦:利用用戶當前的點擊以及所處組別的模型,進行推薦。
2.根據權利要求1所述的一種基于多馬爾可夫鏈的內容推薦方法,其特征是具體為:
1)、原始模型建立:
1.1)、記錄并提取每個用戶的點擊流數據,所述點擊流信息是基于控件的點擊流信息;
1.2)、利用點擊流數據對每個用戶建立馬爾可夫模型,包括轉移矩陣A和初始狀態λ,用戶集合G:
轉移矩陣A中,每個頁面X表示模型的一個狀態,Xt表示當前狀態,Xt-1則表示前
一刻的狀態,設Pij=(Xt=xj|Xt-1=xi),0<i<n,0<j<n,n為總用戶數,即Pij表示由狀態xi轉移到狀態xj的概率,當A所指向的用戶沒有點擊過頁面Xt時,出現Pt1,Pt2,……Ptn,這一行無法計算,設置為零行,
初始狀態λ=(pi)=(pi2,pi2…pin);
當馬爾可夫模型僅由用戶u1的點擊流數據建立時,用戶集合即為G={u1};
1.3)、從網站注冊用戶的注冊文件中獲得用戶背景信息,包括用戶年齡、性別、學歷、工作、地域,根據這些用戶背景信息來建立用戶關系矩陣,并利用用戶背景信息確定用戶之間的相似性;
1.4)、建立評價聚類結果好壞的聚類準則函數,得到初始準則函數值Z;
2)、模型學習階段:
2.1)、計算每個轉移矩陣之間的兩兩相似度,然后確定所有馬爾可夫模型之間的相似度;
2.2)、設定相似度閾值,合并相似度超過閾值的馬爾可夫模型,并計算合并后的馬爾可夫模型的轉移矩陣以及初始狀態,此時的用戶集合G包含了合并的馬爾可夫模型所代表的所有用戶,同時刪除被合并的馬爾可夫模型
2.3)、根據步驟2.2)得到的合并的馬爾可夫模型所代表的用戶,在步驟1.3)得到的用戶關系矩陣中查找相似的用戶,由相似的用戶構成集合GS;
2.4)、利用相似用戶,即集合GS的用戶的點擊流信息來填充2.2)中得到的合并后的馬爾可夫模型的轉移矩陣的零行;
2.5)、計算合并后聚類的準則函數:對步驟2.2)中每一種可行的馬爾可夫模型合并方案都合并,并計算準則函數值,選擇其中最大的準則函數值Z1,與初始準則函數值Z比較,若Z1>Z,則計算當前合并的馬爾可夫模型的兩兩之間的相似度,回到步驟2.2)進行所有可行的合并,即二次合并,選取最大的二次合并的準則函數值Z2與Z1比較,若Z2>Z1則回到步驟2.2)進行三次合并,如此循環直至得到使準則函數值最大的合并,步驟2.4)得到的填充過的馬爾可夫模型最終確定,進入步驟2.6);
2.6)、學習結束;
3)、利用模型進行用戶推薦:
3.1)、用戶產生新的點擊流數據,記錄該點擊流數據用于下一次模型的學習;
3.2)、確定用戶所處的馬爾可夫模型,包括轉移矩陣和初始狀態;若用戶為新用戶,則根據用戶關系矩陣,利用背景信息相似的用戶生產馬爾可夫模型;
3.3)、對用戶當前的點擊流數據以及相應的馬爾可夫模型得到最熱門的推薦,并顯示給用戶;
3.4)、結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010182844.4/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





