[發(fā)明專利]一種評分數(shù)據(jù)噪聲消除方法有效
| 申請?zhí)枺?/td> | 201810576917.4 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN108830315B | 公開(公告)日: | 2021-06-04 |
| 發(fā)明(設計)人: | 陳炳才;劉杰;聶冰洋;趙楠;寧芊;余超;謝冬梅;潘偉民 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/2458 |
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 溫福雪;侯明遠 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 評分 數(shù)據(jù) 噪聲 消除 方法 | ||
1.一種評分數(shù)據(jù)噪聲消除方法,其特征在于,步驟如下:
步驟1.輸入用戶評分矩陣R、用戶集合User和項目集合Item;
步驟2.對評分矩陣數(shù)據(jù)進行平滑處理,得到平滑處理后的評分矩陣R'
2.1)首先將項目按照流行度不同劃分到三個集合中一個,三個集合分別是流行項目集合setpopular、普通項目集合setordinary和不流行項目集合setnpopular;
具體過程如下:
2.1.1)計算項目item的流行度popular(item),計算方法如下:
其中,集合User(item)是對項目item評分過的用戶集合,ru,item是用戶u對項目item的評分;
2.1.2)對評分矩陣評分數(shù)據(jù)進行k-means聚類,聚類個數(shù)為3,聚類后得到三個簇的中心分別為c1、c2、c3,其中c1c2c3;
2.1.3)如果將項目item劃分到流行項目集合setpopular;如果將項目item劃分到普通項目集合setordinary;如果將項目item劃分到不流行項目集合setnpopular;
2.2)計算用戶對于三類項目的評分偏移,分別是differ(u,popular)、differ(u,ordinary)和differ(u,npopular);計算流程如下:
2.2.1)計算用戶u對于流行項目的評分偏移differ(u,popular)
其中,Item(u)是用戶u的評分過的項目集合;是項目item所有評分的平均值;ru,item是用戶u對項目item的評分;
2.2.2)計算用戶u對于普通項目的評分偏移differ(u,ordinary)
2.2.3)計算用戶u對于不流行項目的評分偏移differ(u,npopular)
2.3)填充評分矩陣,具體過程如下:
2.3.1)計算用戶u的評分填充數(shù)量fillNum(u),計算方法如下:
其中,是一個大于1的常數(shù);|R|是原始評分矩陣評分數(shù)量;|User|是用戶規(guī)模;R(u)是用戶u的評分數(shù)量;
2.3.2)計算用戶u未評分過的項目item的填充概率possible(item),計算方法如下:
其中,R(item)是項目item的評分數(shù)量;R(m)是項目m的評分數(shù)量;
2.3.3)在集合Item-Item(u)按照計算的概率隨機抽取項目item進行評分填充,如果fillNum(u)=0,不進行數(shù)據(jù)填充;如果fillNum(u)0,數(shù)據(jù)填充數(shù)量為fillNum(u)次;在填充過程中,如果抽到的item∈setpopular,填充用戶u對于項目item的填充評分如果抽到的item∈setordinary,填充用戶u對于項目item的填充評分如果抽到的item∈setnpopular,填充用戶u對于項目item的填充評分
步驟3.設定模糊指數(shù)值m,簇數(shù)量λ,初始化隸屬度矩陣P和簇中心集合V,設定模糊C均值聚類算法的最大迭代次數(shù)t和精度ε;使用模糊C均值聚類算法對平滑處理后的評分矩陣R'進行模糊聚類,當達到最大迭代次數(shù),或算法達到精度要求后,停止迭代;輸出最終隸屬度矩陣P和簇中心集合V;
步驟4.計算修正后的評分矩陣Ra,具體流程如下:
4.1)取一條原始評分數(shù)據(jù),計算修正后的評分;
假設取出的原始評分數(shù)據(jù)用戶rk,x,是用戶k對項目x的原始評分;計算修正后的評分具體過程如下:
4.1.1)計算在第c個簇中項目x與項目y的流行度差異devc,x,y,計算方法如下:
devc,x,y=Vc,x-Vc,y
其中,1=c=λ;Vc,x是第c個簇的簇中心在項目x上的分量;Vc,y是第c個簇的簇中心在項目y上的分量;
4.1.2)計算修正后的評分計算方法如下:
其中,rk,y是用戶k對項目y的原始評分數(shù)據(jù);Item(x,y)是同時對項目x與項目y同時評分的項目集合;pk,c是用戶k對第c個簇的隸屬度;
4.2)重復(4.1),遍歷原始評分矩陣所有評分,進行評分修正;
步驟5.輸出修正后的評分矩陣Ra。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經(jīng)大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810576917.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





