[發(fā)明專利]基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110683402.6 | 申請日: | 2021-06-21 |
| 公開(公告)號: | CN113393245A | 公開(公告)日: | 2021-09-14 |
| 發(fā)明(設(shè)計)人: | 賈曉萌;謝傳家;姚民偉 | 申請(專利權(quán))人: | 浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司 |
| 主分類號: | G06Q20/40 | 分類號: | G06Q20/40;G06N20/00;G06K9/62 |
| 代理公司: | 濟南信達專利事務(wù)所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 214029 江蘇省無錫市濱*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 運營 數(shù)據(jù) 識別 店鋪 預(yù)警 方法 系統(tǒng) | ||
1.一種基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,該方法是通過采集電子商務(wù)平臺的商品及店鋪的綜合信息,通過對店鋪top商品進行集中分析,識別頁面展示的商品銷量是否為真實銷量,并根據(jù)識別結(jié)果進行刷單預(yù)警;具體如下:
信息爬取:通過對主流電商平臺的店鋪及商品信息進行爬取,獲取店鋪唯一標(biāo)識id、商品id及商品銷量的信息;
篩選店鋪:通過制定的篩選規(guī)則,并借助數(shù)據(jù)庫工具縮小刷單店鋪的檢查范圍;
建立店鋪刷單預(yù)警模型:通過建立店鋪刷單預(yù)警模型對檢查范圍內(nèi)店鋪中的高銷量商品進行判定,輸出對應(yīng)店鋪的高銷量商品是否為刷單商品以及對應(yīng)店鋪是否為刷單店鋪,并將結(jié)果提供給消費者參考。
2.根據(jù)權(quán)利要求1所述的基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,信息爬取具體如下:
利用爬蟲技術(shù),獲取既定周期內(nèi)電商平臺的商品經(jīng)營數(shù)據(jù);其中,商品經(jīng)營數(shù)據(jù)包括商品id、商品名稱、商品銷量及商品銷售額;
利用爬蟲技術(shù)獲取到商品與店鋪的唯一對應(yīng)關(guān)系以及單個商品銷量與店鋪內(nèi)最高銷量的比值,并存儲到數(shù)據(jù)庫中。
3.根據(jù)權(quán)利要求1所述的基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,篩選店鋪具體如下:
利用分布式數(shù)據(jù)處理和過濾技術(shù),將所有可能存在刷單行為的商品提取出來;
通過商品和店鋪的對應(yīng)關(guān)系得到所有可能存在刷單行為的店鋪,將店鋪信息存儲到數(shù)據(jù)庫中。
4.根據(jù)權(quán)利要求3所述的基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,篩選店鋪過程中排除如下兩個情況:
(1)、排除零部件和/或材料批發(fā)店鋪;
(2)、排除低銷量店鋪:月度總銷量低于5000的店鋪不予以考慮。
5.根據(jù)權(quán)利要求1所述的基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,建立店鋪刷單預(yù)警模型具體如下:
數(shù)據(jù)集預(yù)處理;
構(gòu)建店鋪刷單預(yù)警模型;
數(shù)據(jù)分割及店鋪刷單預(yù)警模型調(diào)優(yōu)。
6.根據(jù)權(quán)利要求5所述的基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,數(shù)據(jù)集預(yù)處理具體如下:
去除掉數(shù)據(jù)集中的索引維度,即暫時去掉user_id字段、shop_name字段及shop_url字段;
對數(shù)據(jù)集存在的空值進行補充:出現(xiàn)空值的字段由開店時長、店鋪三項評分以及使用字段平均值對空值進行補充;
使用啞變量對數(shù)據(jù)集中存在非數(shù)值型的字段進行轉(zhuǎn)換,將數(shù)據(jù)集中非數(shù)值型變量轉(zhuǎn)換為數(shù)值型變量。
7.根據(jù)權(quán)利要求5所述的基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,店鋪刷單預(yù)警模型構(gòu)建過程中采用隨機森林來進行分類及預(yù)測任務(wù),具體如下:
采用放回抽樣的方式從數(shù)據(jù)集中抽取獨立的店鋪top商品數(shù)據(jù);
隨機從所有維度中抽取幾個店鋪top商品數(shù)據(jù)完成數(shù)據(jù)的自身構(gòu)建。
8.根據(jù)權(quán)利要求5所述的基于電商運營數(shù)據(jù)識別刷單店鋪的預(yù)警方法,其特征在于,數(shù)據(jù)分割及店鋪刷單預(yù)警模型調(diào)優(yōu)具體如下:
隨機選擇n個屬性進行學(xué)習(xí),使得OOBerror最小的屬性個數(shù)n,在保證每個數(shù)據(jù)的OOBerror最小的同時,使得整個數(shù)據(jù)集的誤差最小;其中,在放回抽樣過程中未被抽取的數(shù)據(jù)稱為袋外數(shù)據(jù);使用袋外數(shù)據(jù)實時監(jiān)測對應(yīng)店鋪top數(shù)據(jù)的誤差,即OutOfBagError袋外誤差,簡稱為OOBerror;
確定數(shù)據(jù)的數(shù)量m,確保數(shù)量m確定后,OOBerror不會再降低;
確定好參數(shù)m后,對隨機森林進行訓(xùn)練,獲取訓(xùn)練結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司,未經(jīng)浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110683402.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q20-00 支付體系結(jié)構(gòu)、方案或協(xié)議
G06Q20-02 .涉及中立的第三方,例如認(rèn)證機構(gòu)、公證人或可信的第三方[TTP]
G06Q20-04 .支付電路
G06Q20-08 .支付體系結(jié)構(gòu)
G06Q20-22 .支付方案或模式
G06Q20-30 .以特定設(shè)備的使用為特征的
- 數(shù)字電視用戶管理系統(tǒng)安全運營的實現(xiàn)方法及系統(tǒng)
- 客服運營健康度和關(guān)鍵運營指標(biāo)評估方法和相關(guān)裝置
- 應(yīng)用運營管理方法、服務(wù)器及計算機可讀存儲介質(zhì)
- 一種頁面配置方法、裝置、服務(wù)器及存儲介質(zhì)
- 運營路線規(guī)劃方法、裝置及存儲介質(zhì)
- 結(jié)合商業(yè)化運營的自動駕駛測試方法及系統(tǒng)
- 運營汽車
- 一種運營任務(wù)分類方法、裝置、設(shè)備和存儲介質(zhì)
- 基于大數(shù)據(jù)和人工智能應(yīng)用的智慧車輛運營系統(tǒng)及方法
- 一種基于人工智能的企業(yè)運營管理平臺
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





