[發明專利]一種基于訓練集優化的推薦系統的動態推薦方法有效
| 申請號: | 201110356894.4 | 申請日: | 2011-11-11 |
| 公開(公告)號: | CN102508907A | 公開(公告)日: | 2012-06-20 |
| 發明(設計)人: | 歐陽元新;蔣祥濤;羅建輝;熊璋 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 李新華;賈玉忠 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 訓練 優化 推薦 系統 動態 方法 | ||
1.一種基于訓練集優化的推薦系統的動態推薦方法,其特征在于:該方法具體步驟如下:
步驟(1)建立初步推薦模型:根據原始的用戶評分數據,利用基于正規化矩陣因式分解推薦模型中的建模方法生成最初的推薦模型;
步驟(2)AdaBoost訓練:利用步驟(1)中生成的推薦模型作為最初分類判定的依據構建分類器,根據推薦模型計算出的推薦值和原始數據值之間的差異情況判定數據的分類,利用AdaBoost算法學習原始訓練樣本,并在每一輪結束后生成新的分類器;
步驟(3)篩選錯誤樣本:在利用AdaBoost算法的訓練過程中每一輪訓練都需要篩選出難樣本,在本方法中難樣本的劃分可以采用預測值與真實值之間的差異性來判斷,即當這種差異大于某一閾值時即判定為難樣本;經過多輪的AdaBoost訓練之后,多次被選定為難樣本的數據可以當作錯誤樣本去除,從而構建出用于下一次迭代所需的訓練數據集合;
步驟(4)重構推薦模型:以步驟(3)中獲得的訓練數據為基礎,結合AdaBoost訓練數據,重新生成推薦模型。
步驟(5)產生推薦結果:以用戶特征向量作為輸入,利用步驟(4)獲得的推薦模型計算出推薦結果并返回給用戶。
2.根據權利要求1所述的一種基于訓練集優化的推薦系統的動態推薦方法,其特征在于:所述第(2)部分中對原始數據集的AdaBoost聚類訓練,具體如下:
步驟①修改正規化矩陣因式分解推薦模型,不再將原始評分數據集合T分割成兩個子集T1、T2,其中,數據集T1用于進行學習,數據集T2用于判定學習停止,而是對數據集T中的所有數據均進行學習,設定AdaBoost訓練的迭代輪數I、每輪學習的次數R、允許的錯誤范圍errPermission,并初始化特征向量集;
步驟②在第一輪的迭代中利用正規化矩陣因式分解推薦模型學習訓練數據R次,在訓練得到的特征向量集之上計算訓練數據中對應用戶對項目的評分的估計值并求出其與真實值ru,i的絕對誤差,即絕對誤差
步驟③當步驟②中計算出的AbsE值大于errPermission時判定次數據為難樣本,遍歷全部的訓練數據獲得難樣本的總數errCountn并由下式計算出樣本的錯誤率εn,其中|T|表示訓練集中的樣本個數;
式中:εn表示樣本錯誤率,|T|表示訓練集中的樣本個數,errCountn表示遍歷全部的訓練數據獲得難樣本的總數;
步驟④根據步驟(3)中計算出來的錯誤率εn調整訓練樣本在下一輪迭代中的學習次數,具體為:當訓練樣本數據的AbsE值小于errPermission時,該樣本在下一輪迭代中的學習次數為trainTimen+1=trainTimen*εn,其中若trainTimen+1<1則取1,當訓練樣本數據的AbsE值大于errPermission時即(2)式中判定其為難樣本時,該樣本在下一輪迭代中的學習次數為
式中:trainTimen樣本在第n次輪迭代中的學習次數,trainTimen+1樣本在第n+1次輪迭代中的學習次數,εn表示步驟(3)中計算出來的錯誤率,AbsE值表示步驟(2)的子步驟②計算出來的絕對誤差,errPermission表示允許的錯誤范圍;
步驟⑤將errPermission以固定比例declineRate縮減之后,開始新一輪的迭代,并且在該輪的迭代中每個樣本的學習次數按照步驟(4)中計算出進行。
3.根據權利要求1或2所述的一種基于訓練集優化的推薦系統的動態推薦方法,其特征在于:所述步驟(3)中的篩選錯誤樣本的方法,具體如下:
步驟A、在步驟(2)中在利用AdaBoost算法的訓練過程中每一輪訓練都需要篩選出難樣本并進行標記和統計;
步驟B、經過多輪的AdaBoost迭代訓練之后,對訓練數據進行遍歷統計每一個樣本被判定成難樣本的次數;
步驟C、根據去除率delRate,將判定成難樣本次數較高的樣本從訓練集中去除,從而得到新的訓練集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110356894.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:汽車儀表配置方法及系統
- 下一篇:自動轉印過程中印刷機滾筒的加速與定相方法





