[發明專利]一種基于用戶偏好與項目屬性的聚類初始點選擇方法有效
| 申請號: | 201410035844.X | 申請日: | 2014-01-24 |
| 公開(公告)號: | CN103793504B | 公開(公告)日: | 2018-02-27 |
| 發明(設計)人: | 宿紅毅;王彩群;閆波;鄭宏 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京理工正陽知識產權代理事務所(普通合伙)11639 | 代理人: | 唐華 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 用戶 偏好 項目 屬性 初始 選擇 方法 | ||
1.一種基于用戶偏好與項目屬性的聚類初始點選擇方法,其特征在于:
步驟1、確定基于項目的相似矩陣;定義項目的特征向量:itemi=(p1,p2,…,pm);其中m為項目的屬性個數,pr(1≤r≤m)代表了此項目第r個特征向量的值;然后每個項目可以轉換為用一個向量itemi=(w1,w2,…,wm)表示,其中向量維數是m,即項目的屬性特征個數,wm表示第m個屬性特征值;然后通過計算表示項目的向量間的距離Aij來表示itemi和itemj之間的相似性,從而構成相似矩陣itemj表示第j個項目,n表示項目的個數;
步驟2、確定基于用戶偏好的同現矩陣;定義用戶對項目的偏好列表:prefs=(user_id,item_id,pref),其中pref代表用戶對項目的評分,所有用戶對項目的評分組成評分列表prefs;通過計算itemi和itemj同時出現在相同的用戶的偏好列表中的次數Bij,來構成同現矩陣
步驟3、確定最終的相似矩陣:其中和β為自定義的權重;
步驟4、去除邊緣點;在TS的每行中,分別計算相似度大于給定閾值θ的項目的個數,記為αq,若是αq的個數小于給定閾值μ表示此點是邊緣點,則從相似矩陣中刪除代表此項目的行和列以此來實現從相似矩陣中去除此邊緣點;遍歷所有的行后完成所有去除邊緣點的操作后再次獲得相似矩陣;
步驟5、選擇聚類初始中心點;所述選擇聚類初始中心點具體包括:
(1)在獲得的相似矩陣中,找出最大相似度,然后將這個最大相似度的兩個點的中心點作為聚類的中心點,記錄到Cluster[]中;并計算兩個點到它們的中心點的距離,找出較大距離的點,將相似矩陣中代表較大的距離的點的行和列刪除,得到新的相似矩陣;
(2)再從上述相似矩陣中找到最大相似度,依次計算具有此最大相似度的兩個點分別到所有聚類初始中心點Cluster[]的距離,若是存在距離小于給定閾值ω,則合并此點到具有最小距離的聚類中,重新計算聚類中心點,否則若是不存在距離小于給定閾值ω,則此點作為新的聚類中心,并將此點作為另外一個初始中心點加入到Cluster[]中;然后將此最大相似度的兩個點所代表的的行和列刪除得到新的相似矩陣;進行迭代,直至聚類中心點的個數為k。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410035844.X/1.html,轉載請聲明來源鉆瓜專利網。





