[發(fā)明專利]一種基于組合算法的個性化圖書推薦方法有效
| 申請?zhí)枺?/td> | 201711149281.7 | 申請日: | 2017-11-18 |
| 公開(公告)號: | CN107943910B | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設(shè)計)人: | 高建彬;單良 | 申請(專利權(quán))人: | 電子科技大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/951;G06K9/62 |
| 代理公司: | 成都弘毅天承知識產(chǎn)權(quán)代理有限公司 51230 | 代理人: | 徐金瓊;劉東 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 組合 算法 個性化 圖書 推薦 方法 | ||
本發(fā)明公開一種基于組合算法的個性化圖書推薦方法,涉及計算機信息領(lǐng)域,包括如下步驟:對圖書的內(nèi)容信息進行關(guān)鍵詞提取,求得圖書的特征向量;求得用戶對某個新書的評分值;生成“用戶行為倒排表和查詢索引”和“圖書行為倒排表和查詢索引”;生成相似度文件和查詢索引:相似用戶索引和查詢索引、相似圖書索引和查詢索引;根據(jù)相似用戶索引和查詢索引、相似圖書索引和查詢索引計算給用戶的圖書推薦指數(shù)。本發(fā)明解決了現(xiàn)有的圖書推薦方法對于對用戶偏好的推斷存在很大的誤差,無法達到良好的圖書推薦的效果的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及適用于針對用戶喜好進行圖書推薦的計算機信息領(lǐng)域,尤其涉及一種基于組合算法的個性化圖書推薦方法。
背景技術(shù)
現(xiàn)有技術(shù)中向用戶推薦電子圖書的方法有多種,第一種方法是基于用戶以往的閱讀歷史數(shù)據(jù),推斷用戶的閱讀偏好,再根據(jù)推斷出的閱讀偏好向用戶推薦對應(yīng)的電子圖書。但在該種方法中,對于用戶閱讀偏好的推斷存在一定不足,主要是:由于閱讀平臺所提供的圖書的類別分布不均,且原創(chuàng)類圖書較多,通常主要集中在言情、穿越等類別;同時由于手機閱讀用戶的主要用戶群是學生、外來務(wù)工人員和都市白領(lǐng),而這一大部分用戶訪問圖書通常集中在言情穿越等熱門分類上,造成系統(tǒng)在對用戶偏好進行判定時大部分用戶的偏好被判定為熱門分類。上述這種情況對于圖書推薦造成很多障礙,例如根據(jù)系統(tǒng)判斷,許多高端商務(wù)人士可能被判定為言情或穿越類的閱讀偏好,對其進行相應(yīng)的圖書推薦容易引起反感和用戶體驗下降。
第二種方法:由于僅根據(jù)歷史數(shù)據(jù)推斷用戶的偏好會造成上述問題,因此,現(xiàn)有技術(shù)中出現(xiàn)了基于用戶身份類型來推斷用戶的閱讀偏好,進而進行相應(yīng)的圖書推薦的方法。但該方法存在如下不足:現(xiàn)有系統(tǒng)主要通過注冊用戶的年齡、性別、職業(yè)特點、產(chǎn)品品牌和手機類型對用戶身份進行逆推,而這些基礎(chǔ)數(shù)據(jù)信息在用戶注冊時由于隱私考慮和技術(shù)等種種原因?qū)е聰?shù)據(jù)存在諸多不準確的情況,從而導(dǎo)致用戶身份類別判定的準確率非常低,進而造成對于用戶偏好的推斷存在很大的誤差,影響了圖書推薦的效果。
可以看出,現(xiàn)有技術(shù)中電子圖書推薦系統(tǒng)主要是基于用戶偏好來進行相應(yīng)的圖書推薦,具體是根據(jù)用戶訪問的歷史數(shù)據(jù)信息或用戶身份類型確定用戶偏好。但對于訪問閱讀平臺系統(tǒng)較少的用戶,可能沒有足夠的歷史數(shù)據(jù)信息;以及當前系統(tǒng)由于種種限制對于用戶身份的判定缺乏可靠的基礎(chǔ),用戶類別判定的準確率較低。因而對于用戶偏好的推斷存在很大的誤差。
發(fā)明內(nèi)容
本發(fā)明的目的在于:現(xiàn)有技術(shù)中存在這兩個問題:(1)電子圖書推薦系統(tǒng)主要是基于用戶偏好來進行相應(yīng)的圖書推薦,具體是根據(jù)用戶訪問的歷史數(shù)據(jù)信息或用戶身份類型確定用戶偏好,但對于訪問閱讀平臺系統(tǒng)較少的用戶,可能沒有足夠的歷史數(shù)據(jù)信息;(2)以及當前系統(tǒng)由于種種限制對于用戶身份的判定缺乏可靠的基礎(chǔ),用戶類別判定的準確率較低,因而對于用戶偏好的推斷存在很大的誤差;為了解決這兩個問題,本發(fā)明提供一種基于組合算法的個性化圖書推薦方法。
本發(fā)明的技術(shù)方案如下:
一種基于組合算法的個性化圖書推薦方法,包括如下步驟:
S1:對新書的名稱、介紹等內(nèi)容信息進行關(guān)鍵詞提取,進而求得圖書的特征向量,用這些關(guān)鍵詞標示該圖書。
S2:根據(jù)用戶瀏覽或下載到的圖書的特征向量求得用戶的特征向量,進而求得用戶對某個新書的評分值。
S3:通過用戶-圖書實際行為數(shù)據(jù)對來統(tǒng)計每個用戶的行為圖書和每個圖書的行為用戶,生成“TOP N用戶行為倒排表和查詢索引”和“圖書行為倒排表和查詢索引”。
S4:根據(jù)用戶的相同行為圖書個數(shù)與各自行為圖書個數(shù)計算兩個用戶之間的相似度,以及兩本圖書之間的相似度,生成相似度文件和查詢索引:TOP N相似用戶索引和查詢索引、相似圖書索引和查詢索引。
S5:根據(jù)TOP N相似用戶索引和查詢索引、相似圖書索引和查詢索引計算給用戶的圖書推薦指數(shù)。
具體地,所述S1的具體步驟包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學,未經(jīng)電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711149281.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





