[發明專利]一種基于區間分割的電商水軍識別方法有效
| 申請號: | 202110401328.4 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113674045B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 孫宏亮;劉國鑫;丁俊杰;錢子杰;卜湛;曹杰 | 申請(專利權)人: | 南京財經大學 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06F16/903;G06F17/11;G06F17/16 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 孫昱 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 區間 分割 商水 識別 方法 | ||
本發明公開一種基于區間分割的電商水軍識別方法,步驟是:使用Z?score對初始數據進行標準化;計算出每個商品正確的評分區間,在該區間內的評分被認為是合理的,反之不合理;計算出各個用戶評分的準確率和極差;計算出用戶的各個評分到對應商品正確評分區間的距離和,并結合用戶評分的準確率和極差,計算出來用戶的信譽。最后,選擇前N個低信譽用戶作為水軍。我們在三個數據集(MoiveLens、Netflix和Amazon)上測試了該方法,結果表明該方法在計算用戶信譽和識別水軍方面表現良好,具有較高的準確性和魯棒性,且可擴展性強。
技術領域
本發明屬于計算機網絡內的信息技術領域,包含了對大數據的精密分析,涉及到了在電子商務系統通過用戶的評分特征來評估用戶信譽的方法,是一種通過分析帶權的用戶-商品二部圖從而得出用戶信譽的一種評估及計算方法。
背景技術
隨著經濟以及網絡技術的發展,在網上完成商品交易更加便捷與實惠,這極大地促進了電子商務的發展,而在交易過程中,商品評分是用戶選擇時一個十分重要的標準,因此我們需要建立可靠的評分系統。在當前的信譽評分系統中存在著許多問題,其中最普遍的即為用戶的隨意評分或者惡意評分所引發的評分偏差問題,尤其是存在請水軍進行大規模的好評或者差評,以此來提高或者降低某個商品的評分的情況,這會嚴重誤導消費者。而水軍這個群體數量眾多,評分不依據客觀事實,同時隱蔽性強,混雜于大量正常用戶中,對商品評分造成了不良影響。這對電子商務平臺的發展是不利的,嚴重影響了網上商品交易的正常秩序。因此,構建一個穩定、可靠的用戶和商品信譽系統是十分重要的,如果能有一種算法,我們既能剔除惡意用戶,又能評估出一個商品的真實質量,這對電子商務的發展乃至整個社會的發展都是極其有利的。
用戶-商品信譽系統需要大量用戶的評分數據來支撐。我們通過量化用戶對商品的影響來反應商品的質量并計算用戶的信譽。水軍雖然隱蔽性非常強,但通過優質的算法,可以通過水軍的評分記錄分析出水軍與正常用戶的區別,以此來篩選出水軍。水軍群組存在兩個非常典型的例子,隨機水軍群組以及極端水軍群組。隨機水軍群組出于對商品的不夠了解等原因,忽略商品質量而隨機打分。極端水軍群組為了擾亂商品的正常評分,對商品進行最高或最低評分。為了篩選出這兩種典型的水軍群組,近些年通過大量的實驗,許多優質信譽評價算法涌現了出來。
基于相關性的思想:P.LAURETI等人提出了一種迭代的(IR)方法,在這種方法中,用戶的信譽與他的評分和相應對象的質量之間的差值成反比,用戶信譽和商品質量是迭代計算,直到它們變得穩定。Zhou等人提出了基于相關系數的排名(CorrelationbasedRanking,CR)方法,該方法對惡意用戶攻擊具有較強的魯棒性,其中用戶的信譽是由他的評分和對象的估計質量之間的相關系數決定的。Liao 等人通過引入信譽再分配過程和兩個懲罰因子,進一步改進了CR方法。
基于群組的思想:Gao等人提出了基于群組的排名(Group-based Ranking, GR)方法。后來Gao等人在2015年又在GR的基礎上提出了基于群組的迭代排名(Iterative group-based ranking,IGR)的方法,在GR的基礎上增加了迭代部分。迭代的運用在后續研究中得到了廣泛的運用。Wu等人在消除用戶評分偏差 (Eliminating the Effect of RatingBias,IBR)方法中也運用了迭代的思想,將用戶評分的偏差與原來的評分對比分為三類,一是消極,二是積極,三是無影響,商品的質量是通過用戶的偏差進行修正的。雖然基于偏差的算法在極端用戶攻擊中取得了卓越效果,但是對于隨機用戶并沒有明顯的提升。
基于特定分布假設思想:LEE DAEKYUNG等人提出了基于偏差的隨機惡意用戶篩選方法(Deviation-based Ranking,DR)。基于Beta分布假設的由 WuYing-Ying等人提出的BR(Bayesian Ranking)算法。以上算法在數據量較大、且比較稀疏的情況下,表現不是很好,魯棒性欠佳。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京財經大學,未經南京財經大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110401328.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:對被測設備進行測量的方法
- 下一篇:一種新型的防松螺母系統





