[發明專利]一種基于高斯混合的大數據智能推薦方法有效
| 申請號: | 201710844205.1 | 申請日: | 2017-09-19 |
| 公開(公告)號: | CN107545471B | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 楊永麗;寧振虎;薛菲;公備;王昱波 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q30/06;G06K9/62;G06N3/00 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 混合 數據 智能 推薦 方法 | ||
1.一種基于高斯混合的大數據智能推薦方法,其特征在于:該方法的實現步驟如下,
(1)基于用戶興趣的相似度預測模型;首先,通過PLSA模型構建用戶和項目的聯合概率,基于此概率形式,構建合適的似然函數即大數據智能推薦模型;然后,通過CFPSO即粒子群算法優化EM算法從而求解大數據智能推薦模型中的參數;最后,運用大數據智能推薦模型求解目標用戶對項目的預測評分;
a.構建用戶和項目的聯合概率;對于每一個三維向量u,ii,v,其中u,ii,v分別為用戶u、項目ii、及用戶u對項目ii的評分;引入潛在變量Z={z1,z2,…zi,…zk},其中zi為不同的聚類群體,1≤i≤k,用P(zk|u)表示用戶u屬于zk群體的概率且P(v|ii,zi)表示群體zi對項目ii評分v的概率;則用戶和項目的聯合概率為:
b.構建似然函數即大數據智能推薦模型;假定群體z對項目ii評分v的條件概率P(v|ii,z)符合高斯分布,有P(v|ii,z)=N(μi,z,σi,z)=P(v;μi,z,σi,z),其中μi,z,σi,z分別為群體Z對項目i評分的均值和方差,則用戶和項目的聯合概率是一個滿足高斯混合的概率模型:則得到對數似然函數為:
c.參數初始化選擇;針對參數P(z|u),μi,z,采用K-means聚類算法對參數進行初始化;同時,運用CFPSO算法對初始化后的參數進行優化;設定粒子群的數目為n,任意粒子l的位置表示為Xl=(x1,x2,…xn),選擇(1)式作為適應度函數;則基于CFPSO優化EM算法的步驟如下:
第一步:初始化粒子種群;給定粒子群的數目同時對粒子群中每個粒子的初始位置和速度進行初始化,位置和速度公式如下:
其中,表示第l個粒子在t+1時刻d維空間的速度,ε為壓縮因子,ω為慣性權重,c1,c2為加速常數,r1和r2為隨機數,與分別表示粒子l在t時刻d維空間的個體最優和全局最優值,表示第l個粒子在t+1時刻d維空間的位置;
第二步:計算粒子群中各個粒子的適應度值,并更新粒子的當前個體最優位置pbest和粒子群的群體最優位置gbest;
第三步:對粒子群的gbest根據EM算法對其進行更新;比較更新前后的適應度值,如果更新后的gbest值使得適應度函數值變大,則更新種群最優位置gbest信息,否則不予更新;
第四步:對更新后的種群最優值gbest進行校驗,如果其滿足要求,則結束CFPSO算法,并取得gbest值的屬性信息作為EM算法的初始參數;否則轉至第五步;
第五步:根據公式(2)和(3)更新粒子群中粒子個體的速度和位置參數并轉至第二步繼續執行;其中,EM算法的執行步驟如下:
E步:根據每一個評分向量u,i,v,計算得到每個潛在的變量z∈Z的后驗概率P(z|u,v,i),如下:
M步:根據E步計算得到的后驗概率,并結合拉格朗日最優化極值對似然函數求偏導可得到P(z|u),μi,z,的值,分別如下:
根據CFPSO優化EM算法的初始化參數,交替執行E步和M步,直到收斂,求得參數P(z|u),μi,z,作為大數據推薦模型的參數集;
d.用戶興趣相似度模型預測評分;通過M步中的參數集,構造基于高斯混合的用戶興趣相似度模型,從而計算用戶u對項目i的預測評分,具體公式如下:
(2)基于項目的預測模型;根據對項目打分的用戶越多,則項目之間的相似度越高;同時,由于同類物品出現的時間越相近,則各物品之間的相似度越高,因此引入項目時間因子,定義如下:
其中,ti和tj為項目i和項目j出現的時間;定義項目i和j的相似度為sim(i,j):
其中,U(i)和U(j)分別是對項目i和j評分的用戶集合,ru,i和ru,j表示用戶u對項目i和項目j的評分,和表示所有用戶對項目i和項目j的平均評分,θ為非負數;則定義用戶對項目的預測評分如下:
其中,S(i)為項目i的鄰域集合,這里選擇項目是否加入鄰域的方式為判斷兩項目的相似度是否大于一定的閾值,這樣的計算的方式減少項目之間的比較排序,節約運算時間;
(3)線性加權預測;將用戶興趣相似預測模型與基于項目的預測模型運用線性加權的方式將二者的預測評分進行結合,從而計算出用戶對項目的最終預測評分,其公式計算如下:
rateu,i=α×rate_uHMMu,i+β×rate_Itemu,i,0<α<1,α+β=1 (12)
綜上,對協同過濾算法中用戶對項目的預測評分進行改進,分別通過高斯混合、CFPSO、EM算法建立基于用戶興趣相似度預測模型,通過添加時間因子建立基于項目預測模型,從而將二者的預測評分進行線性結合,作為用戶對項目的最終預測評分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710844205.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





