[發明專利]一種基于改進型協同過濾算法的音頻推薦方法有效
| 申請號: | 201410257826.6 | 申請日: | 2014-06-11 |
| 公開(公告)號: | CN104239390B | 公開(公告)日: | 2017-12-29 |
| 發明(設計)人: | 趙凡;占焱清 | 申請(專利權)人: | 杭州聯匯科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州杭誠專利事務所有限公司33109 | 代理人: | 王江成,盧金元 |
| 地址: | 310052 浙江省杭州市濱*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進型 協同 過濾 算法 音頻 推薦 方法 | ||
技術領域
本發明涉及用戶需求分析推薦領域,尤其是涉及一種用于網絡音頻播放系統的基于改進型協同過濾算法的音頻推薦方法。
背景技術
隨著互聯網技術的蓬勃發展,我們已經處在信息大爆炸時代,如何從紛繁復雜的信息中找到對自己有用的信息變得非常重要和急迫,從分類目錄發展搜索引擎,在查找知識的效率方面有了顯著的提升,你可以根據任何一個關鍵字查找和這個關鍵字匹配的內容。但是這有個前提,那就是你知道要找什么。實踐證明,往往很多時候我們并不知道如何給自己想要的信息定義一個準確的關鍵字。解決此問題的一個有效的方法是利用推薦系統。
推薦系統的原理是,機器通過每次和人的交互自動學習,并利用一些數學模型將交互行為量化為各項指標,從而建立一個虛擬的人物角色,學習的越多,人物角色的定義也就越精確,最后通過搜索引擎按當前的時空環境猜測用戶接下來可能的行為,給出合理的推薦。
目前,推薦系統到處可見,國外的Amazon、Netflix,國內的淘寶,京東,豆瓣FM,蝦米等,都在一定程度上給我們提供了很多建議,簡化了我們查找信息、購物、聽音樂、看電影等查找信息的復雜度。常見的推薦系統算法主要有:基于內容推薦、協同過濾推薦、基于關聯規則推薦、基于效用推薦、基于知識推薦和組合推薦。
各推薦算法的優缺點如下表:
中華人民共和國國家知識產權局于2014年02月05日公開了申請公布號CN103559622A的專利文獻,名稱是基于特征的協同過濾推薦方法,其包括以下步驟:步驟一、根據物品的特征,將原有的物品-用戶打分矩陣投影到不同的物品特征上,得到多個聚合的特征-用戶打分矩陣;步驟二、對于每一個用戶統計其在各個特征上打分的方差,并用該方差值刻畫用戶對該特征的好惡程度,方差越大,表明用戶對該特征的取值有越強偏向;步驟三、基于各個特征-用戶打分矩陣,預測用戶對某新物品的打分值;步驟四、利用步驟二各特征上打分的方差,對步驟三計算得到的打分預測值進行加權平均,得到用戶對該物品的最終打分預測值;步驟五、基于最終的打分預測值,進行物品推薦。此方案沒有考慮到已打分物品和未打分物品之間的相關性,推薦精度不夠高,容易出現誤推薦的情況。
發明內容
本發明主要是解決現有技術所存在的不能考慮已打分項目和未打分項目之間的相關性、推薦精度不夠高等的技術問題,提供一種引入已打分項目和未打分項目之間的相關度、排除相關度低的項目、有效提高推薦精度的基于改進型協同過濾算法的音頻推薦方法。
本發明針對上述技術問題主要是通過下述技術方案得以解決的:一種基于改進型協同過濾算法的音頻推薦方法,包括以下流程:
S1、查找與目標用戶相似度最高的N個鄰居用戶;
S2、選擇一個未評分項目c,計算未評分項目c與目標用戶在有效時間內的最高評分項目之間的項目相關性Rc;未評分項目定義為目標用戶未評分過的項目;
S3、根據鄰居用戶對未評分項目c的評分值和項目相關性Rc計算目標用戶對未評分項目c的預計評分值Pc;
S4、重復步驟S2和S3,直至所有未評分項目都被計算出預計評分值;
S5、將所有未評分項目根據預計評分值進行排序,向用戶推薦預計評分值最高的M個未評分項目。
作為優選,所述步驟S1中,查找與目標用于相似度最高的N個鄰居用戶具體為:
S11、選擇一個鄰居用戶,查找目標用戶和此鄰居用戶都評分過的所有項目;設查找到的項目數量為n;
S12、計算目標用戶和此鄰居用戶之間的相似度r,計算公式為
式中,xi為目標用戶對第i個項目的評分,為目標用戶對查找到的n個項目的平均評分值,yi為此鄰居用戶對第i個項目的評分,為此鄰居用戶對查找到的n個項目的平均評分值;
S13、重復步驟S11和S12,直至所有鄰居用戶都計算完畢;
S14、對所有鄰居用戶根據相似度排序,選擇相似度最高的N個鄰居用戶。
作為優選,步驟S2中,計算未評分項目c與目標用戶在有效時間內的最高評分項目之間的項目相關性Rc具體為:
S21、讀取未評分項目c各個標簽的值;
S22、讀取所述最高評分項目的各個標簽的值;
S23、計算所述最高評分項目和此未評分項目c之間的相關性Rc,計算公式如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州聯匯科技股份有限公司,未經杭州聯匯科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410257826.6/2.html,轉載請聲明來源鉆瓜專利網。





