[發明專利]一種基于圖書內容的圖書推薦方法有效
| 申請號: | 201110447928.0 | 申請日: | 2011-12-27 |
| 公開(公告)號: | CN102542046A | 公開(公告)日: | 2012-07-04 |
| 發明(設計)人: | 韓軍 | 申請(專利權)人: | 紐海信息技術(上海)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201203 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖書 內容 推薦 方法 | ||
技術領域
本發明涉及計算機技術領域,尤其涉及到基于內容的圖書推薦方法。
背景技術
近年來,隨著計算機與網絡技術的進步,電子商務得到了快速發展,尤其是網上圖書零售發展十分迅速。網上圖書零售不但能給電子商務企業帶來可觀的收益,更重要的是能吸引人氣,帶來客戶流量,它已經成為大型電子商務企業的核心業務之一。
由于網上書店可以在網站上呈現比實體書店更多的內容,為了幫助客戶快速找到合適的圖書,同時也為了吸引客戶購買更多的圖書,需要采用圖書推薦系統自動為客戶生成圖書推薦。
目前,大多數的推薦系統都是針對商品類別進行分類,然后通過協同推薦或同類商品銷售排行來進行推薦。其缺點有二:第一,這些推薦系統都是針對百貨商品來分類的,沒有針對圖書內容做優化,僅僅只能將圖書照搬百貨商品的做法分門別類做推薦,導致推薦效果不佳;第二,其采用的協同推薦方法對于已經形成銷售規模,具備大量銷售數據的網站比較適用,但是對于剛剛上線的圖書網站,由于缺少交易數據,難以形成有效的推薦。另外,目前很多的推薦系統都沒有反映存貨情況,向用戶推薦的商品最終卻缺貨,顯然會大大降低用戶體驗。
發明內容
有鑒于此,一種能反映圖書內容,能夠結合庫存信息、促銷信息的圖書推薦方法是十分有益的。
為了解決上述問題,本發明提供了一種基于書名、作者、內容摘要、目錄等信息,并結合庫存數據和促銷信息的圖書推薦方法,其技術方案包括:
在新加入一本圖書時,首先獲取其內容信息,并將這些內容存為特征向量。比如,將書名存為特征向量dt,將作者存為特征向量da,將內容摘要存為特征向量ds,將目錄存為特征向量dc。這些特征向量將進一步處理提取關鍵詞和權重,并用于圖書之間相關性計算的特征參數。
其次,針對上述4種特征向量分別進行特征詞的提取和特征詞的權重計算,計算結果表示為:
d=(w1,w2,...,wn)
其中,wi代表特征詞i出現的次數也即特征詞i的權重;
然后,利用基于權重融合的余弦相似度函數來計算圖書間的相關性,計算公式如下:
C(Bx,By)=a×sim(dt,x,dt,y)+b×sim(da,x,da,y)
??????+c×sim(ds,x,ds,y)+d×sim(dc,x,dc,y)
其中,C是圖書之間的相關度,Bx?By代表圖書x和y,sim(dx,dy)是余弦相似度函數,a、b、c、d是不同特征向量的權重;融合圖書的四種特征向量dt、da、ds、dc得到圖書間基于內容的相關系數C。
接下來,根據和不同圖書之間相關系數C的大小,選取相關系數最大的N本圖書,得到該圖書的推薦列表L0。
最后,結合庫存數據和促銷信息對L0重新排序得到最終的推薦列表L。
本發明還可以通過下述方法強化推薦效果:
上述基于權重融合的余弦相似度函數用于計算圖書之間相關性,其權重取值設定為a=b=c=d=25%。
上述余弦相似度函數sim(dx,dy)用于計算項目dx和dy的相關程度,其計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于紐海信息技術(上海)有限公司,未經紐海信息技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110447928.0/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





