[發(fā)明專利]用戶類型的確定方法、確定裝置、介質(zhì)及電子設備有效
| 申請?zhí)枺?/td> | 201710742913.4 | 申請日: | 2017-08-25 |
| 公開(公告)號: | CN107516246B | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設計)人: | 申肆;閆強;李愛華 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿(mào)易有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62 |
| 代理公司: | 北京律智知識產(chǎn)權代理有限公司 11438 | 代理人: | 闞梓瑄;王衛(wèi)忠 |
| 地址: | 100195 北京市海淀區(qū)杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 類型 確定 方法 裝置 介質(zhì) 電子設備 | ||
1.一種用戶類型的確定方法,其特征在于,包括:
獲取用戶已完成的訂單數(shù)據(jù);
根據(jù)獲取到的訂單數(shù)據(jù),確定用戶已完成的每個訂單對應的用戶特征數(shù)據(jù),所述用戶特征數(shù)據(jù)包括用戶完成訂單的行為路徑和用戶在預定時段內(nèi)首次瀏覽同類商品的時間到下單時間之間的時間間隔,所述行為路徑為所述用戶在完成所述訂單時瀏覽頁面的順序;
根據(jù)所述行為路徑和所述時間間隔,對用戶類型進行第一次劃分,包括:根據(jù)所述時間間隔,查找各個用戶在所述預定時段內(nèi)首次瀏覽同類商品的時間和下單時間為同一天的目標訂單;基于所述行為路徑與用戶類型的關聯(lián)關系,根據(jù)所述目標訂單對應的行為路徑,對用戶類型進行第一次劃分;
基于所述第一次劃分的結(jié)果對所述訂單數(shù)據(jù)進行過濾,得到過濾后的訂單數(shù)據(jù);
根據(jù)所述過濾后的訂單數(shù)據(jù),對用戶類型進行第二次劃分,包括:獲得所述過濾后的訂單數(shù)據(jù)對應的除所述行為路徑之外的其他用戶特征數(shù)據(jù);對所述其他用戶特征數(shù)據(jù)進行聚類處理,以得到多個類;基于所述多個類來確定用戶的類型。
2.根據(jù)權利要求1所述的用戶類型的確定方法,其特征在于,在根據(jù)獲取到的訂單數(shù)據(jù),確定用戶已完成的每個訂單對應的用戶特征數(shù)據(jù)之前,還包括:
從獲取到的訂單數(shù)據(jù)中刪除處于預定時間段內(nèi)的訂單數(shù)據(jù);和/或
從獲取到的訂單數(shù)據(jù)中刪除異常用戶的訂單數(shù)據(jù)。
3.根據(jù)權利要求1所述的用戶類型的確定方法,其特征在于,基于所述行為路徑與用戶類型的關聯(lián)關系,根據(jù)所述目標訂單對應的行為路徑,對用戶類型進行第一次劃分的步驟,包括:
針對任一用戶的所述目標訂單,確定與各個用戶類型相關聯(lián)的行為路徑對應的所述目標訂單的個數(shù);
若與任一用戶類型相關聯(lián)的行為路徑對應的所述目標訂單的個數(shù)達到預定值,則將所述任一用戶類型作為所述任一用戶的類型。
4.根據(jù)權利要求3所述的用戶類型的確定方法,其特征在于,基于所述第一次劃分的結(jié)果對所述訂單數(shù)據(jù)進行過濾的步驟,包括:
從所述訂單數(shù)據(jù)中刪除經(jīng)過所述第一次劃分后已確定了用戶類型的用戶的所有訂單數(shù)據(jù);和/或
從所述訂單數(shù)據(jù)中刪除與所述各個用戶類型相關聯(lián)的行為路徑對應的所述目標訂單。
5.根據(jù)權利要求1所述的用戶類型的確定方法,其特征在于,在對所述其他用戶特征數(shù)據(jù)進行聚類處理之前,還包括:檢測并刪除所述其他用戶特征數(shù)據(jù)中的離群點。
6.根據(jù)權利要求1所述的用戶類型的確定方法,其特征在于,在對所述其他用戶特征數(shù)據(jù)進行聚類處理之前,還包括:對所述其他用戶特征數(shù)據(jù)進行標準化處理。
7.根據(jù)權利要求1所述的用戶類型的確定方法,其特征在于,采用改進的K-means算法對所述其他用戶特征數(shù)據(jù)進行聚類處理,具體包括:
從所述其他用戶特征數(shù)據(jù)中選擇K個點作為類的初始質(zhì)心;
在將所述其他用戶特征數(shù)據(jù)中的任一點劃分至任一類時,重新計算所述任一類的質(zhì)心,并計算所有類的樣本方差;
若所述所有類的樣本方差的最大值大于或等于預設方差,則將迭代次數(shù)加1,并繼續(xù)劃分所述其他用戶特征數(shù)據(jù)中的其他點,直到迭代次數(shù)達到預定次數(shù)為止;
若所述所有類的樣本方差的最大值小于所述預設方差,則將所述所有類的樣本方差的最大值作為所述預設方差的值,并繼續(xù)劃分所述其他用戶特征數(shù)據(jù)中的其他點。
8.根據(jù)權利要求7所述的用戶類型的確定方法,其特征在于,在采用改進的K-means算法對所述其他用戶特征數(shù)據(jù)進行聚類處理之前,還包括:
獲取針對K-means算法預設的多個K值;
在所述K-means算法取所述多個K值中的每個值對所述其他用戶特征數(shù)據(jù)進行聚類時,分別計算相應的輪廓系數(shù);
將最大的輪廓系數(shù)對應的K值作為所述其他用戶特征數(shù)據(jù)的聚類個數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術有限公司;北京京東世紀貿(mào)易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710742913.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





