[發明專利]用戶行為傾向識別方法、裝置、設備及存儲介質在審
| 申請號: | 202011436696.4 | 申請日: | 2020-12-11 |
| 公開(公告)號: | CN112527958A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 盧春曦;王健宗;黃章成 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F16/36;G06N20/00 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 行為 傾向 識別 方法 裝置 設備 存儲 介質 | ||
1.一種用戶行為傾向識別方法,其特征在于,所述用戶行為傾向識別方法包括:
獲取具有確定行為傾向的多個樣本用戶發布的多條第一文本信息及所述各第一文本信息對應的第一記錄參數;
提取所述各第一文本信息中的多個關鍵詞,統計所述各第一文本信息中所述各關鍵詞出現的次數并進行向量化處理,得到多個關鍵詞向量;
以所述各關鍵詞向量及所述各第一記錄參數為訓練樣本,從所述各訓練樣本中多次隨機抽取多個樣本,得到多個訓練集;
參照預置判別指標,構建所述各訓練集對應的決策樹,并根據所述各決策樹生成對應的隨機森林模型;
獲取待檢測用戶發布的多條第二文本信息及所述各第二文本對應的第二記錄參數;
將所述各第二文本信息和所述各第二記錄參數輸入所述隨機森林模型進行投票,得到投票結果;
根據所述投票結果,確定所述待檢測用戶是否具有所述行為傾向。
2.根據權利要求1所述的用戶行為傾向識別方法,其特征在于,所述提取所述各第一文本信息中的多個關鍵詞包括:
對所述第一文本信息進行分詞處理,得到多個詞單元;
采用TF-IDF算法計算所述各詞單元的區分度;
對所述各詞單元的區分度進行排序,并從排序結果中提取區分度最高的詞單元作為關鍵詞。
3.根據權利要求1或2所述的用戶行為傾向識別方法,其特征在于,所述統計所述各第一文本信息中所述各關鍵詞出現的次數并進行向量化處理,得到多個關鍵詞向量包括:
根據所述各關鍵詞,分別確定所述各樣本用戶發布的第一文本信息中所包含的關鍵詞;
統計所述各樣本用戶發布的第一文本信息中所述各關鍵詞出現的次數;
對所述各關鍵詞出現的次數進行向量轉化,得到各樣本用戶對應的關鍵詞向量。
4.根據權利要求1所述的用戶行為傾向識別方法,其特征在于,所述參照預置判別指標,構建所述各訓練集對應的決策樹,并根據所述各決策樹生成對應的隨機森林模型包括:
采用分類回歸樹算法,以預置判別指標作為決策樹的特征選擇,對所述各訓練集中的所述各訓練樣本進行決策樹分類,得到多棵決策樹;
依次組合所述各決策樹,得到隨機森林模型,其中,所述判別指標包括關鍵詞向量、命中不同關鍵詞的個數、命中關鍵詞的總數、平均文本長度、敏感發言時間以及敏感發言天數。
5.根據權利要求1或4所述的用戶行為傾向識別方法,其特征在于,所述參照預置判別指標,構建所述各訓練集對應的決策樹包括:
S1、選擇一個判別指標作為根節點,計算所述根節點對應的各判別指標值對所述訓練集的基尼指數;
S2、判斷所述各基尼指數是否大于預置第一閾值且所述樣本集中的樣本個數大于預置第二閾值;
S3、若是,則將所述訓練集劃分為多個葉節點,并選擇基尼指數最小的判別指標值作為根節點,循環執行S1-S2;
S3、若否,則生成所述訓練集對應的決策樹。
6.根據權利要求1所述的用戶行為傾向識別方法,其特征在于,所述將所述各第二文本信息和所述各第二記錄參數輸入所述隨機森林模型進行投票,得到投票結果包括:
統計所述第二文本信息中所述各關鍵詞出現的次數并進行向量轉化,得到目標向量;
將所述目標向量及所述第二記錄參數輸入所述隨機森林模型進行分類,得到分類結果;
令所述隨機森林模型中的所有決策樹對所述分類結果進行投票,得到投票結果。
7.根據權利要求1或6所述的用戶行為傾向識別方法,其特征在于,所述根據所述投票結果,確定所述待檢測用戶是否具有所述行為傾向包括:
獲取所述隨機森林模型中所有決策樹的投票結果,其中,所述投票結果為具有所述行為傾向和/或不具有所述行為傾向;
根據所述各投票結果,計算不同行為傾向對應的投票比率;
將投票比率最高的行為傾向作為所述待檢測用戶具有的行為傾向。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011436696.4/1.html,轉載請聲明來源鉆瓜專利網。





