[發明專利]基于譜聚類的人群分類方法、裝置及介質在審
| 申請號: | 201910462022.2 | 申請日: | 2019-05-30 |
| 公開(公告)號: | CN110276382A | 公開(公告)日: | 2019-09-24 |
| 發明(設計)人: | 金戈;徐亮 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京鴻元知識產權代理有限公司 11327 | 代理人: | 張超艷;李玉琦 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人群分類 分群結果 人群特征 分類模型 隨機森林 聚類 標簽 存儲介質 電子裝置 分類結果 用戶推薦 智能決策 分組 預測 構建 混淆 采集 | ||
1.一種基于譜聚類的人群分類方法,其特征在于,包括:
設定人群分類類別;
采集人群特征;
建立隨機森林模型,將人群特征輸入所述隨機森林模型,得到第一分群結果,將第一分群結果中各用戶所屬的人群分類類別作為預測標簽;
對各人群分類類別進行分組,分別構建各組的分類模型;
將上述各用戶的人群特征及對應預測標簽輸入各自對應分組的分類模型,得到各用戶的第二分群結果,將第二分群結果作為最終分類結果;
根據第二分群結果,對不同人群分類類別的用戶推薦不同產品;
其中,所述對各人群分類類別進行分組,分別構建各組的分類模型的步驟包括:
構建樣本庫,用于存儲樣本,所述樣本為已經確定人群分類類別的用戶的人群特征;
將樣本庫中多個樣本輸入隨機森林模型,得到樣本的第一分群結果及樣本的預測標簽;
通過樣本的第一分群結果利用混淆矩陣和譜聚類方法獲得樣本的預測標簽的分組;
建立樣本的各分組的分類模型。
2.根據權利要求1所述的基于譜聚類的人群分類方法,其特征在于,所述對各人群分類類別進行分組,分別構建各組的分類模型的步驟還包括:
所述樣本庫中的一部分樣本作為訓練集,一部分樣本作為驗證集;
采用訓練集對隨機森林模型進行訓練;
將驗證集代入訓練集訓練后的隨機森林模型,得到驗證集各樣本的預測標簽,通過混淆矩陣和聚類方法確定人群分類類別的分組,根據各組的驗證集的人群特征及預測標簽構建各分組的分類模型。
3.根據權利要求1所述的基于譜聚類的人群分類方法,其特征在于,通過樣本的第一分群結果利用混淆矩陣和譜聚類方法獲得樣本的預測標簽的分組的步驟包括:
輸出樣本的第一分群結果的混淆矩陣,混淆矩陣表示各個人群分類類別之間的混淆情況;
將混淆矩陣作為相似度矩陣建立向量空間,并將相似度作為空間距離進行聚類,得到人群分類類別的分組。
4.根據權利要求3所述的基于譜聚類的人群分類方法,其特征在于,所述將混淆矩陣作為相似度矩陣建立向量空間的步驟包括:
將混淆矩陣中記錄樣本錯誤預測為其他人群分類類別的數量轉換為比例,并將替換為比例的混淆矩陣與記錄數量的混淆矩陣的轉置乘積,獲得相似度矩陣。
5.根據權利要求1所述的基于譜聚類的人群分類方法,其特征在于,所述采集人群特征步驟之后還包括對人群特征進行數據處理的步驟,包括:
獲得人群特征的特征變量;
將所述特征變量劃分為連續變量和離散變量,所述連續變量是具有次序屬性的數值型變量,所述離散變量是非數值型變量;
檢查所述離散變量的離散值數量,將超過設定離散值數量的離散變量作為第一類離散變量,不超過設定離散值數量的離散變量作為第二類離散變量;
對第一離散變量進行衍生處理;
對離散特征為無序離散值的第二類離散變量和第一類離散變量進行編碼;
對離散特征為有序離散值的第二類離散變量和第一類離散變量進行量化處理。
6.根據權利要求1所述的基于譜聚類的人群分類方法,其特征在于,所述分類模型包括邏輯回歸分類模型和決策樹分類模型中的一種或兩種。
7.根據權利要求6所述的基于譜聚類的人群分類方法,其特征在于,所述邏輯回歸分類模型的構建方法包括:
通過線性方式對分類概率進行擬合,并根據對數損失函數通過梯度下降方法進行訓練,邏輯回歸的輸入特征為隨機森林的輸入特征,以及隨機森林預測分類結果的one-hot形式特征。
8.根據權利要求1所述的基于譜聚類的人群分類方法,其特征在于,所述建立隨機森林模型的步驟包括:
通過訓練樣本的隨機抽樣以及可選特征的隨機抽樣,構造多個樹模型進行分類預測投票,以輸出分類預測結果,樣本包含了人群特征以及人群分類類別標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910462022.2/1.html,轉載請聲明來源鉆瓜專利網。





