[發明專利]一種基于RBM與差分隱私保護的聚類的電影推薦方法及系統有效
| 申請號: | 201810973951.5 | 申請日: | 2018-08-24 |
| 公開(公告)號: | CN109033453B | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 陳志立;喬明浩;仲紅;張順;崔杰 | 申請(專利權)人: | 安徽大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/62 |
| 代理公司: | 合肥興東知識產權代理有限公司 34148 | 代理人: | 胡東升 |
| 地址: | 230601 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 rbm 隱私 保護 電影 推薦 方法 系統 | ||
1.一種基于RBM與差分隱私保護的聚類的電影推薦方法,其特征在于,該推薦方法包括以下流程:
S1、初始化階段:收集所有用戶對項目的評分信息,生成一個用戶項目評分矩陣;
S2、聚類階段:在得到的用戶項目評分矩陣中,以單個用戶為基礎,對所有用戶進行聚類操作,把所有用戶分為k個類;
S3、生成推薦模型階段:得到所有用戶的聚類結果,然后在每個聚類中使用RMB算法生成各自的推薦模型;
S4、在線用戶電影推薦階段:用戶登錄系統,在推薦模型中選出評分高的且用戶無觀看記錄的T個項目推送到用戶界面;
在所述的聚類階段中,具體地,包括以下過程:
(1)隨機生成k個M維的向量作為初始的聚類中心點;
(2)分別計算每個用戶到這k個聚類中心點的距離,得到用戶距離k個中心點的距離,用戶屬于距離其最近的中心點所確定的聚類;
(3)所有用戶都完成計算后,分別計算每個聚類中所有用戶的各維數據平均值,將其作為新的聚類中心點;
(4)在新的聚類中心點基礎上重復步驟(2)、步驟(3),直至聚類中心點不再改變為止,否則重復步驟(2)、步驟(3)直至聚類中心點不再改變;
(5)聚類穩定后判斷每個聚類所含用戶的數目,若其所含用戶的數目大于2N/k,或小于N/2k,則需要重新聚類;
(6)待上述步驟完成,計算每個聚類的中心點并加入Laplace(5k/2εN)的噪聲,然后對所有用戶再進行一次聚類,得到最終聚類結果;
在所述的生成推薦模型階段中:具體地,包括以下過程:
(1)對于每個用戶,使用RBM推薦算法對M個電影項目進行評分,生成一個6行M列的矩陣,矩陣中的元素為0或1;
(2)若用戶的評分為r,則在對應的r+1行填入1,此項目對應的其他行數據用0填充,每個用戶作為一個RBM輸入;
(3)RBM對應的顯示層節點數為用戶進行評分項目的數目,隱藏層的節點的個數為h,h在實驗過程中根據經驗取值,每個聚類中所有用戶對應的隱藏層節點個數相同;
(4)每個用戶訓練其各自的權重矩陣,聚類中所有用戶對于相同項目的權重為單個用戶對此項目權重的平均值,最終得到聚類對應的權重矩陣。
2.根據權利要求1所述的基于RBM與差分隱私保護的聚類的電影推薦方法,其特征在于,在所述的初始化階段中:
所述的用戶對項目的評分信息為文件形式,其包括存儲用戶編號、項目編號、用戶對項目的評分、評分時間;
生成用戶項目評分矩陣的具體方法為:模型訓練首先把文件形式的評分信息進行處理,提取其中的用戶編號、項目編號、用戶對項目的評分,從而得到用戶項目評分矩陣;其中用戶數為N,項目數為M,評分范圍為1-5,沒有評分的項目默認評分為0。
3.根據權利要求1所述的基于RBM與差分隱私保護的聚類的電影推薦方法,其特征在于,所述k個M維的向量的數據范圍為0-5,所述距離為歐幾里得距離。
4.根據權利要求1所述的基于RBM與差分隱私保護的聚類的電影推薦方法,其特征在于,所述權重訓練過程為:用戶的評分向量作為RBM輸入,得到隱藏層節點的輸出值,然后以隱藏層值為輸入,求出顯示層節點對應的值,判斷反饋的顯示層值與原先輸入顯示層值的誤差,當誤差小于預先設定的閾值或達到預先設定的迭代上限,權重矩陣訓練完成,若不滿足結束條件,則調整權重矩陣繼續迭代計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學,未經安徽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810973951.5/1.html,轉載請聲明來源鉆瓜專利網。





