[發(fā)明專利]一種產(chǎn)品推薦方法、裝置和計算設備有效
| 申請?zhí)枺?/td> | 201611103409.1 | 申請日: | 2016-12-05 |
| 公開(公告)號: | CN106779929B | 公開(公告)日: | 2020-12-29 |
| 發(fā)明(設計)人: | 王碰 | 申請(專利權)人: | 北京知道創(chuàng)宇信息技術股份有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06 |
| 代理公司: | 北京思睿峰知識產(chǎn)權代理有限公司 11396 | 代理人: | 謝建云;趙愛軍 |
| 地址: | 100102 北京市朝陽區(qū)阜*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 產(chǎn)品 推薦 方法 裝置 計算 設備 | ||
1.一種產(chǎn)品推薦方法,在計算設備中執(zhí)行,所述計算設備中存儲有多個用戶的多條消費記錄,所述消費記錄包括用戶的特征信息和消費產(chǎn)品,所述特征信息包括的具體屬性根據(jù)銷售平臺所銷售的產(chǎn)品的類型確定,所述方法包括:
獲取目標用戶的特征信息;
根據(jù)所述目標用戶的特征信息,采用第一分類器確定第一推薦產(chǎn)品,其中,所述第一分類器為以存儲的所有多條消費記錄為樣本訓練得出;
根據(jù)所述目標用戶的特征信息,采用第二分類器確定第二推薦產(chǎn)品,其中,所述第二分類器為以存儲的消費產(chǎn)品不是第一推薦產(chǎn)品的多條消費記錄為樣本訓練得出;
將第一推薦產(chǎn)品和第二推薦產(chǎn)品作為向目標用戶推薦的產(chǎn)品;
其中,所述第一推薦產(chǎn)品和第二推薦產(chǎn)品均指消費產(chǎn)品類別而非具體產(chǎn)品,且是兩個不同的消費產(chǎn)品類別。
2.如權利要求1所述的方法,其中,所述特征信息包括以下屬性中的一個或多個:用戶ID,用戶性質,用戶與銷售公司是否同城,是否使用過安全產(chǎn)品,使用過哪些安全產(chǎn)品,DOS攻擊次數(shù),CC攻擊次數(shù),ARP攻擊次數(shù),DNS攻擊次數(shù),數(shù)據(jù)庫攻擊次數(shù),被植入木馬或病毒次數(shù),被域名劫持次數(shù),被篡改次數(shù),權限攻擊次數(shù)。
3.如權利要求1所述的方法,其中,所述第一分類器和第二分類器為分類樹,所述第一分類器和第二分類器按照以下步驟訓練:
對于每一個節(jié)點:將分裂前后GINI指數(shù)增量最大的屬性作為最佳分裂屬性,將分裂后的GINI指數(shù)最小的分裂條件作為最佳分裂條件,根據(jù)最佳分裂屬性和最佳分裂條件對該節(jié)點進行分裂,產(chǎn)生兩個子節(jié)點;
當滿足設置的終止條件時,停止節(jié)點的分裂。
4.如權利要求3所述的方法,其中,分裂前的GINI指數(shù)按照以下公式計算:
其中,D為節(jié)點所包括的樣本集,k為樣本集中所包括的消費產(chǎn)品類別的數(shù)量,Pi為消費產(chǎn)品為i的樣本數(shù)量占D中所包括的所有樣本的比例;
分裂后的GINI指數(shù)按照以下公式計算:
其中,A表示分裂屬性,j表示分裂條件,D1、D2分別為按照分裂屬性A和分裂條件j對節(jié)點進行分裂所得的兩個子節(jié)點所包括的樣本集,|D1|、|D2|、|D|為樣本集D1、D2、D中所包括的樣本的數(shù)量;
GINI指數(shù)增量按照以下公式計算:
Δ GINI(A)=GINI(D)-GINIA(D)
其中,A為分裂屬性,GINIA(D)為GINIAj(D)中的最小值。
5.如權利要求3所述的方法,其中,所述終止條件是以下條件中的任意一種:
節(jié)點中所包括的樣本的消費產(chǎn)品類別均相同;
樹的深度達到了預設的深度閾值;
節(jié)點中所包括的樣本的數(shù)量小于預設的第一閾值;
節(jié)點中所包括的樣本數(shù)量的平方與分裂后的兩個子節(jié)點中的樣本數(shù)量的平方和之差小于預設的第二閾值。
6.如權利要求3所述的方法,其中,在停止節(jié)點的分裂之后,還包括:對第一分類器按照從葉節(jié)點到根節(jié)點的順序進行剪枝:
對于有葉節(jié)點的節(jié)點,計算該節(jié)點的每一個葉節(jié)點的第一誤判率;
計算該節(jié)點的第二誤判率;
若第二誤判率大于至少一個第一誤判率,則將第一誤判率最小的葉節(jié)點的消費產(chǎn)品類別作為該節(jié)點的消費產(chǎn)品類別,剪掉該節(jié)點的所有葉節(jié)點。
7.如權利要求6所述的方法,其中,
葉節(jié)點f的第一誤判率=(Ef+a)/Nf,
第二誤判率=(E+2*a)/N,
其中,Ef為葉節(jié)點f中被錯分的樣本數(shù)量,Nf為葉節(jié)點f中所包括的樣本數(shù)量,E為該節(jié)點中被錯分的樣本數(shù)量,N為該節(jié)點中所包括的樣本數(shù)量,a為懲罰因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京知道創(chuàng)宇信息技術股份有限公司,未經(jīng)北京知道創(chuàng)宇信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611103409.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





