[發明專利]一種基于馬爾科夫鏈的圖書推薦方法有效
| 申請號: | 201210460908.1 | 申請日: | 2012-11-16 |
| 公開(公告)號: | CN102982131A | 公開(公告)日: | 2013-03-20 |
| 發明(設計)人: | 廖建新;郭偉東;張雷;趙貝爾;崔曉茹 | 申請(專利權)人: | 杭州東信北郵信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100191 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 馬爾科夫鏈 圖書 推薦 方法 | ||
1.一種基于馬爾科夫鏈的圖書推薦方法,其特征在于,所述方法包括有:
步驟一、查詢用戶的閱讀歷史數據,并基于樸素貝葉斯算法,計算用戶的初始狀態概率向量:???????????????????????????????????????????????????=(???,???),其中,???、???分別是用戶對圖書的喜歡、不喜歡狀態,???是用戶當前閱讀圖書的標簽向量,???、???分別是用戶對圖書的喜歡、不喜歡狀態概率;
步驟二、查詢用戶的當前閱讀圖書和所有未閱讀圖書,并根據所有用戶對該用戶的當前閱讀圖書和未閱讀圖書的喜歡和不喜歡狀態,分別計算該用戶當前閱讀圖書到每個未閱讀圖書的轉移概率矩陣;
步驟三、根據用戶的初始狀態概率向量、和用戶當前閱讀圖書到未閱讀圖書的轉移概率矩陣,分別計算用戶從當前閱讀圖書轉移到每個未閱讀圖書的狀態概率向量,所述狀態概率向量包括有用戶對未閱讀圖書的喜歡狀態概率,并據此向用戶推薦未閱讀圖書。
2.根據權利要求1所述的方法,其特征在于,所述步驟一中,???的計算公式如下,j=0表示喜歡,j=1表示不喜歡:????,其中,???是用戶喜歡或不喜歡圖書的情況下對應圖書標簽的概率,???是用戶喜歡或不喜歡一本圖書的先驗概率,???是一個根據圖書自身屬性信息而定義的常量。
3.根據權利要求2所述的方法,其特征在于,所述???的計算公式是:???,其中,n是用戶的當前閱讀圖書包含的標簽總數,???是用戶的當前閱讀圖書所包含的標簽k,???是用戶喜歡或不喜歡標簽k的概率。
4.根據權利要求3所述的方法,其特征在于,所述???的計算公式是:???,其中,???是用戶閱讀過,并且喜歡或不喜歡的所有圖書包含的標簽總數,???是用戶閱讀過,并且喜歡或不喜歡的所有圖書包含的標簽k的總數。
5.根據權利要求2所述的方法,其特征在于,所述???的計算公式是:???,其中,???是用戶喜歡或不喜歡的圖書總數,S是用戶閱讀過的圖書總數。
6.根據權利要求2所述的方法,其特征在于,根據用戶的閱讀歷史數據來計算???和???的比例,并根據???,即可計算出???和???具體數值。
7.根據權利要求1所述的方法,其特征在于,所述步驟二中,用戶的當前閱讀圖書u到未閱讀圖書v的轉移概率矩陣???,其中,???是從喜歡圖書u到喜歡圖書v的狀態轉移概率,???是從喜歡圖書u到不喜歡圖書v的狀態轉移概率,???是從不喜歡圖書u到喜歡圖書v的狀態轉移概率,???是從不喜歡圖書u到不喜歡圖書v的狀態轉移概率。
8.根據權利要求7所述的方法,其特征在于,所述???的計算公式如下,i/或t=0表示對圖書u/或v是喜歡狀態,i/或t=1表示對圖書u/或v是不喜歡狀態:???,其中,U是連續讀過圖書u和v的用戶總數,???是在連續讀過圖書u和v的用戶中,由對圖書u的狀態i直接轉移到對圖書v的狀態j的用戶總數。
9.根據權利要求1所述的方法,其特征在于,所述步驟三中,用戶從當前閱讀圖書u轉移到未閱讀圖書v的狀態概率向量???的計算公式如下:???,其中,???是用戶的當前閱讀圖書u到未閱讀圖書v的轉移概率矩陣。
10.根據權利要求9所述的方法,其特征在于,???,其中,???是用戶對未閱讀圖書v的喜歡狀態概率,???是用戶對未閱讀圖書v的不喜歡狀態概率。
11.根據權利要求10所述的方法,其特征在于,按照用戶對未閱讀圖書的喜歡狀態概率值的大小,對所有未閱讀圖書進行排序,并從中挑選出喜歡狀態概率值最大的若干本圖書向用戶推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州東信北郵信息技術有限公司,未經杭州東信北郵信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210460908.1/1.html,轉載請聲明來源鉆瓜專利網。





