[發明專利]一種用戶的分類方法及裝置在審
| 申請號: | 201910948666.2 | 申請日: | 2019-10-08 |
| 公開(公告)號: | CN110717787A | 公開(公告)日: | 2020-01-21 |
| 發明(設計)人: | 張茂洪 | 申請(專利權)人: | 恩億科(北京)數據科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62 |
| 代理公司: | 11646 北京超成律師事務所 | 代理人: | 劉靜 |
| 地址: | 100000 北京市海淀區西小口路66*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類用戶 屬性特征 樣本 待選用戶 特征矩陣 用戶分群 用戶屬性 分類 房屋價格 用戶分類 用戶特征 分群 樓層 篩選 房屋 居住 申請 | ||
1.一種用戶的分類方法,其特征在于,包括:
獲取多個樣本待分類用戶中每個樣本待分類用戶的待選用戶屬性特征下的特征值;所述用戶屬性特征包括用戶居住區域、房屋價格、房屋面積以及樓層中一種或者多種;
基于各個樣本待分類用戶的待選用戶屬性特征下的特征值,對所述待選用戶屬性特征進行篩選,從所述待選用戶屬性特征中,確定至少一個選定用戶屬性特征;
基于各個所述樣本待分類用戶的在各個選定用戶屬性特征下的特征值,構成用于表征各個樣本待分類用戶屬性特征的特征矩陣;
基于各個樣本待分類用戶的特征矩陣,訓練得到用戶分群模型;
基于預先訓練的用戶分群模型中,對待分類用戶進行分群。
2.根據權利要求1所述的方法,其特征在于,所述基于各個樣本待分類用戶的待選用戶屬性特征下的特征值,對所述待選用戶屬性特征進行篩選,包括:
針對每種待選用戶屬性特征,基于各個所述樣本待分類用戶分別在該待選用戶屬性特征下的特征值,得到該待選用戶屬性特征對應的標準差;將該待選用戶屬性特征對應的標準差與預設標準差閾值進行比對;
若該待選用戶屬性特征對應的標準差大于所述預設標準差預閾值,則將該待選用戶屬性特征確定為選定用戶屬性特征。
3.根據權利要求1所述的方法,其特征在于,基于各個所述樣本待分類用戶的在各個選定用戶特征下的特征值,構成用于表征各個樣本待分類用戶屬性特征的特征矩陣,包括:
針對在所有選定用戶特征下均不存在特征值確實的樣本待分類用戶,基于該樣本待分類用戶在各個選定用戶特征下均不存在特征值,構成該樣本待分類用戶的特征矩陣;
針對在任一選定用戶特征下存在特征值缺失的樣本待分類用戶,基于除該樣本待分類用戶外的其他樣本待分類用戶在該任一選定用戶特征下的特征值,對該樣本待分類用戶在該任一選定用戶特征下的特征值進行數據填充,得到該樣本待分類用戶在該任一選定用戶特征下的填充值;
基于該樣本待分類用戶在該任一選定用戶特征下的填充值,以及該樣本待分類用戶在其他未存在缺失的選定用戶特征下的特征值,構成該樣本待分類用戶的特征矩陣。
4.根據權利要求3所述的方法,其特征在于,基于除該樣本待分類用戶外的其他樣本待分類用戶在該任一選定用戶特征下的特征值,對該樣本待分類用戶在該任一選定用戶特征下的特征值進行數據填充,包括:
確定除該樣本待分類用戶外的其他樣本待分類用戶在該任一選定用戶特征下的特征值的平均數或眾數,基于確定的所述平均數或者眾數,對該樣本待分類用戶在該任一選定用戶特征下的特征值進行數據填充。
5.根據權利要求1所述的方法,其特征在于,所述用戶分群模型包括:嶺回歸模型、套索回歸模型、彈性網絡模型、輕量級梯度提升機模型、以及梯度回歸決策樹模型;
基于各個樣本待分類用戶的特征矩陣,訓練得到用戶分群模型,包括:
針對每個樣本待分類用戶,將該樣本待分類用戶的特征矩陣依次輸入至嶺回歸模型、套索回歸模型、彈性網絡模型、輕量級梯度提升機模型、以及梯度回歸決策樹模型,得到與嶺回歸模型、套索回歸模型、彈性網絡模型、輕量級梯度提升機模型、以及梯度回歸決策樹模型分別對應的中間預測分類結果;
基于嶺回歸模型、套索回歸模型、彈性網絡模型、輕量級梯度提升機模型、以及梯度回歸決策樹模型分別對應的中間預測分類結果,得到與該樣本待分類用戶對應的預測分類結果;
基于各個樣本待分類用戶分別對應的實際分類結果,以及預測分類結果,對嶺回歸模型、套索回歸模型、彈性網絡模型、輕量級梯度提升機模型、以及梯度回歸決策樹模型進行本輪訓練,并訓練嶺回歸模型、套索回歸模型、彈性網絡模型、輕量級梯度提升機模型、以及梯度回歸決策樹模型分別對應的權重;
對嶺回歸模型、套索回歸模型、彈性網絡模型、輕量級梯度提升機模型、以及梯度回歸決策樹模型進行多輪訓練,得到用戶分群模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恩億科(北京)數據科技有限公司,未經恩億科(北京)數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910948666.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種權益發放的方法和系統
- 下一篇:一種目標用戶的篩選方法及裝置





