[發明專利]引入空間衰減函數的興趣點推薦算法在審
| 申請號: | 201610050080.0 | 申請日: | 2016-01-25 |
| 公開(公告)號: | CN105718581A | 公開(公告)日: | 2016-06-29 |
| 發明(設計)人: | 余正生;常曉雨 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 杜軍 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 引入 空間 衰減 函數 興趣 推薦 算法 | ||
1.引入空間衰減函數的興趣點推薦算法,其特征在于:該方法的具 體步驟如下:
步驟1、收集簽到網站中用戶簽到數據;
表1簽到網站中用戶簽到數據集
表1中:u代表用戶的編號,1≤u≤m,m為收集的用戶總數;v代表 興趣點的編號,1≤v≤n,n為興趣點總數;ruv代表用戶u對興趣點v的 評分,Av代表興趣點v的緯度,Ov代表興趣點v的經度;
步驟2、建立包含興趣點位置信息的“用戶-興趣點”評分矩陣R(m ×n),評分矩陣含m個用戶和n個興趣點,興趣點的位置信息用興趣點 的經緯度來表示,如表2所示;隨機選取1/8的簽到興趣點作為測試集, 剩余7/8的興趣點作為訓練集;
表2包含興趣點位置信息的“用戶-興趣點”評分矩陣
步驟3、使用傳統興趣點相似度求解公式求解興趣點i,j之間的相似 度w(i,j),1≤i≤n,1≤j≤n;傳統興趣點相似度求解公式有:余弦相似度 求解公式、修正余弦相似度求解公式和皮爾遜相關系數相似度求解公式;
相關參數設置:rui和ruj分別表示用戶u對興趣點i和興趣點j的評分, 用戶沒有對興趣點評分被設置為0,和分別表示m個用戶對興趣點i 和興趣點j的平均評分,表示用戶u對興趣點的平均評分,U(i)和U(j) 分別表示對興趣點i和興趣點j評分的用戶集合,U(i,j)表示同時對興趣點 i,j評分的用戶集合;
3.1余弦相似度求解公式;在余弦相似度求解公式中,通過興趣點評 分向量之間的夾角余弦來度量它們之間的相似度;興趣點i,j的余弦相 似度如下:
3.2修正余弦相似度求解公式;它在余弦相似度基礎上進行了改進, 通過減去用戶對興趣點的平均評分解決了余弦相似度沒有考慮用戶評分 等級差異的問題;興趣點i,j的修正余弦相似度如下:
3.3皮爾遜相關系數相似度求解公式;與修正余弦相似度一樣,它也 解決了用戶評分等級差異的問題;興趣點i,j的皮爾遜相關系數相似度 如下:
步驟4、三種興趣點相似度求解公式分別代入興趣點的預測評分公式 形成三種傳統興趣點推薦算法,分別預測出用戶u對測試集內各個興趣 點的預測評分;用戶u對興趣點i的預測評分公式如下:
式中,S(i,K)表示和興趣點i最相似的K個興趣點的集合,N(u)表示用戶 u訪問興趣點的集合;
步驟5、每種傳統興趣點推薦算法都推薦出預測評分值最大的N個興 趣點;
步驟6、通過召回率、精準度和F指標評價傳統興趣點推薦算法的推 薦性能;
R(u)表示用戶u推薦的N個興趣點的集合,T(u)表示用戶u實際感興 趣的興趣點集合,則召回率P1、精準度P2和F指標F,分別由下式求得:
召回率描述的是在用戶實際感興趣的興趣點當中被推薦的比例,精 準度描述的是推薦列表當中用戶實際感興趣的興趣點所占的比例,但這2 個指標經常出現相互矛盾的情況,往往1個指標增大的同時另1個指標 隨之減小,為了綜合考慮召回率和精準度,還用到了綜合評價指標F指 標;
步驟7、在推薦性能最好的傳統興趣點推薦算法基礎上引入空間衰減 函數,得到引入空間衰減函數的興趣點推薦算法,具體如下:
7.1找到推薦性能最好的傳統興趣點推薦算法;
由推薦列表長度N的不同值,根據三種傳統興趣點推薦算法中召回 率、精準度和F指標選取最好的傳統興趣點推薦算法;
7.2引入空間衰減函數f(d(i,j)),其中d(i,j)是興趣點i和興趣點j之 間的大圓距離,大圓距離指的是從球面的一點出發沿球面到達球面上另 一點所經過的最短路徑的長度;設置興趣點i和興趣點j的編號分別是c 和d,1≤c≤n,1≤d≤n,分別用經緯度(Ac,Oc)和(Ad,Od)表示興趣點i 和興趣點j的坐標,則大圓距離的計算公式如下:
式中,R表示地球的平均半徑,取值為6371.009km,d(i,j)的單位為km;
空間衰減函數f(d(i,j))的定義需滿足下列條件:興趣點i和j之間的 大圓距離越大,則f(d(i,j))越小,興趣點i和j之間的相似度越小,從而 降低用戶對距離更遠的興趣點的簽到行為對推薦結果的影響;首先給出 適合簽到網站中用戶簽到數據集的空間衰減函數類型,然后對空間衰減 函數預設參數,并將含有預設參數的空間衰減函數作為權值代入步驟7.3 的公式中;在進行推薦算法推薦性能實驗時,通過給定不同的空間衰減 函數預設參數值來得到不同的召回率、精確度和F指標,根據這些指標 選取適合簽到網站中用戶簽到數據集的空間衰減函數預設參數值,此時, 即可確定適合簽到網站中用戶簽到數據集的空間衰減函數;
7.3引入空間衰減函數的興趣點推薦算法如下:
w′(i,j)=w″(i,j)f(d(i,j))(9)
式中:w″(i,j)表示推薦性能最好的傳統興趣點推薦算法中運用的傳統 興趣點相似度求解公式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610050080.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鋼制強化玻璃纖維制雙層油罐
- 下一篇:短鏈接生成方法及裝置





