[發(fā)明專利]一種刷單識別方法在審
| 申請?zhí)枺?/td> | 202010428470.3 | 申請日: | 2020-05-20 |
| 公開(公告)號: | CN111598588A | 公開(公告)日: | 2020-08-28 |
| 發(fā)明(設(shè)計)人: | 馬喜萍 | 申請(專利權(quán))人: | 廣州鵠志信息咨詢有限公司 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06Q30/06;G06Q30/02 |
| 代理公司: | 北京廣技專利代理事務(wù)所(特殊普通合伙) 11842 | 代理人: | 崔征 |
| 地址: | 510000 廣東省廣州市天河*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識別 方法 | ||
1.一種刷單識別方法,其特征在于,包括:
獲取商戶的銷售記錄并判斷所述銷售記錄是否異常;
在確定所述銷售記錄異常時,獲取用戶的行為特征信息并判斷所述用戶的行為特征信息是否異常;
在確定用戶的行為特征信息異常時,判斷該商戶存在刷單行為。
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取商戶的銷售記錄并判斷所述銷售記錄是否異常,包括:
獲取商戶在第一時間段內(nèi)的第一銷量;
獲取商戶在第二時間段內(nèi)的第二銷量;其中,所述第一時間段與所述第二時間段的時長相等;
在判斷所述第二銷量與第一銷量的第一銷量比不在第一預(yù)設(shè)銷量比范圍內(nèi)時,判斷所述銷售記錄異常。
3.如權(quán)利要求1所述的方法,其特征在于,所述獲取商戶的銷售記錄并判斷所述銷售記錄是否異常,包括:
獲取商戶在黃金時間段內(nèi)的第三銷量;
獲取商戶在低谷時間段內(nèi)的第四銷量;
在判斷所述第四銷量與第三銷量的第二銷量比大于第二預(yù)設(shè)銷量比時,判斷所述銷售記錄異常。
4.如權(quán)利要求1所述的方法,其特征在于,所述行為特征信息包括用戶的愛好產(chǎn)品信息;獲取用戶的行為特征信息并判斷所述用戶的行為特征信息是否異常,包括:
獲取用戶的愛好產(chǎn)品信息;
獲取用戶購買所述商戶的產(chǎn)品信息;
根據(jù)所述用戶的愛好產(chǎn)品信息判斷用戶對所述商戶的產(chǎn)品愛好值;
在判斷所述愛好值低于預(yù)設(shè)愛好值時,判定所述用戶對所述商戶的產(chǎn)品不喜歡,判定所述用戶的行為特征信息異常。
5.如權(quán)利要求4所述的方法,其特征在于,所述獲取用戶的愛好產(chǎn)品信息,包括:
獲取每個用戶的基本數(shù)據(jù)及歷史行為數(shù)據(jù);
對所述基本數(shù)據(jù)及歷史行為數(shù)據(jù)進(jìn)行預(yù)處理;所述預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)編解碼;
獲取預(yù)處理后得到的基本數(shù)據(jù)及歷史行為數(shù)據(jù),進(jìn)行特征提取,獲取特征值輸入預(yù)先訓(xùn)練好的用戶愛好模型中,輸出用戶對各類產(chǎn)品的愛好值,得到用戶的愛好產(chǎn)品信息。
6.如權(quán)利要求1所述的方法,其特征在于,所述行為特征信息包括用戶的當(dāng)次瀏覽產(chǎn)品的信息;獲取用戶的行為特征信息并判斷所述用戶的行為特征信息是否異常,包括:
獲取用戶的當(dāng)次瀏覽產(chǎn)品的信息;
獲取用戶的歷史瀏覽產(chǎn)品的信息;
根據(jù)用戶的歷史瀏覽產(chǎn)品的信息按照預(yù)設(shè)規(guī)則判斷用戶的當(dāng)次瀏覽產(chǎn)品的信息是否異常;所述預(yù)設(shè)規(guī)則包括:用戶的翻頁數(shù)和/或用戶的翻頁時間;
在確定用戶的當(dāng)次瀏覽產(chǎn)品的信息異常時,判定用戶的行為特征信息異常。
7.如權(quán)利要求1所述的方法,其特征在于,所述行為特征信息包括用戶的評價信息;獲取用戶的行為特征信息并判斷所述用戶的行為特征信息是否異常,包括:
獲取各個用戶對于商戶產(chǎn)品的評價信息;
對所述評價信息進(jìn)行篩選處理得到有效評價信息;
對每個有效評價信息進(jìn)行特征提取,獲取評價特征值輸入預(yù)先訓(xùn)練好的評價相似度模型中,聚合所述評價相似度模型的輸出結(jié)果,得到所述有效評價信息與其他有效評價信息的多個相似度值;
在所述相似度值大于預(yù)設(shè)相似度閾值時,將所述相似度值對應(yīng)的兩個有效評價信息的作為同一用戶的評價信息,判定兩個有效評價信息為同一人所寫。
8.如權(quán)利要求7所述的方法,其特征在于,訓(xùn)練評價相似度模型,包括:
獲取樣本評價信息;
對樣本評價信息進(jìn)行進(jìn)行特征提取,得到評價特征值;所述評價特征值包括詞向量;
對樣本信息進(jìn)行多次篩選處理,將每次篩選的兩個樣本評價信息作為一個樣本組;
基于神經(jīng)網(wǎng)絡(luò)模型,將兩個樣本評價信息的各自的評價特征值輸入神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,輸出該兩個樣本評價信息的相似度,反復(fù)循環(huán)的迭代更新神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)參數(shù),直至模型收斂,得到評價相似度模型。
9.如權(quán)利要求6所述的方法,其特征在于,獲取用戶的行為特征信息并判斷所述用戶的行為特征信息是否異常,算法包括:
計算用戶的當(dāng)次瀏覽產(chǎn)品的信息的第一特征向量X與用戶的歷史瀏覽產(chǎn)品的信息的第二特征向量Y的相似度:
其中,Xi為第一特征向量X的分量;Yi為第二特征向量Y的分量;n為特征向量的分量的個數(shù);k為修正系數(shù);sim(X,Y)∈(0,1),在sim(X,Y)越接近0時,表示相似度越低;在sim(X,Y)越接近1時,表示相似度越高;
其中,P1為根據(jù)歷史瀏覽產(chǎn)品的信息確定的第一愛好值;P2為根據(jù)當(dāng)次瀏覽產(chǎn)品的信息確定的第二愛好值;C為當(dāng)次瀏覽產(chǎn)品的種類系數(shù);基于同一種類物品,在|P1-P2|越大時,表示第一愛好值與第二愛好值的差值越大,修正系數(shù)k越小;在|P1-P2|越小時,表示第一愛好值與第二愛好值的差值越小,修正系數(shù)k越大;
在sim(X,Y)小于預(yù)設(shè)相似度閾值時,表示用戶的行為特征信息異常。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州鵠志信息咨詢有限公司,未經(jīng)廣州鵠志信息咨詢有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010428470.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





