[發明專利]用戶篩選方法、裝置、設備及存儲介質在審
| 申請號: | 202010144416.6 | 申請日: | 2020-03-04 |
| 公開(公告)號: | CN111506798A | 公開(公告)日: | 2020-08-07 |
| 發明(設計)人: | 余雯;黃承偉 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/62 |
| 代理公司: | 深圳市力道知識產權代理事務所(普通合伙) 44507 | 代理人: | 張傳義 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 篩選 方法 裝置 設備 存儲 介質 | ||
1.一種用戶篩選方法,其特征在于,包括:
獲取待識別用戶的線下圖像數據和線上數據,所述線下圖像數據包括拜訪記錄圖像;
對所述拜訪記錄圖像進行圖像處理,以得到所述待識別用戶的線下拜訪數據;
將所述線下拜訪數據和線上數據作為所述待識別用戶的基礎數據,并對所述基礎數據進行特征衍生以得到所述待識別用戶的特征數據;
根據預先訓練的用戶識別模型對所述待識別用戶的特征數據進行特征因子匹配,所述預先訓練的用戶識別模型用于識別出目標用戶的特征因子;
當所述待識別用戶的特征數據與所述用戶識別模型中的特征因子的匹配度滿足預設條件時,確定所述待識別用戶為目標用戶。
2.根據權利要求1所述的用戶篩選方法,其特征在于,所述對所述拜訪記錄圖像進行圖像處理,以得到所述待識別用戶的線下拜訪數據,包括:
對所述拜訪記錄圖像進行預處理,所述預處理包括二值化、噪聲去除和傾斜矯正;
對預處理后的所述拜訪記錄圖像進行版面分析和字符識別,以得到識別結果;
根據所述識別結果確定線下拜訪數據。
3.根據權利要求1所述的用戶篩選方法,其特征在于,所述線下圖像數據還包括人臉識別圖像;
所述將所述線下拜訪數據和線上數據作為所述待識別用戶的基礎數據,包括:
根據所述人臉識別圖像將所述線下拜訪數據與線上數據進行關聯,以得到所述待識別用戶的基礎數據。
4.根據權利要求1所述的用戶篩選方法,其特征在于,在所述根據預先訓練的用戶識別模型對所述待識別用戶的特征數據進行特征因子匹配之前,還包括:
對所述待識別用戶的特征數據進行數據清洗,以得到清洗后的所述待識別用戶的特征數據。
5.根據權利要求1所述的用戶識別方法,其特征在于,還包括:
獲取樣本數據,并依次對所述樣本數據進行特征提取和特征衍生以得到樣本特征數據;
對所述樣本特征數據進行數據清洗,以得到清洗后的樣本特征數據;
將所述清洗后的樣本特征數據按照產品購買規則進行分類,以分別獲得正樣本集和負樣本集;
基于所述正樣本集和負樣本集利用隨機森林算法訓練用戶識別模型,得到所述預先訓練的用戶識別模型。
6.根據權利要求5所述的用戶篩選方法,其特征在于,還包括:
對所述清洗后的樣本特征數據進行變量處理,得到處理后的樣本特征數據;
所述將所述清洗后的樣本特征數據按照產品購買規則進行分類,以分別獲得正樣本集和負樣本集,包括:
將所述處理后的樣本數據按照產品購買規則進行分類,以分別獲得正樣本集和負樣本集。
7.根據權利要求5所述的用戶篩選方法,其特征在于,在所述基于所述正樣本集和負樣本集利用隨機森林算法訓練用戶識別模型之前,還包括:
判斷所述負樣本集與所述正樣本集的樣本數量差是否大于預設閾值;
若所述負樣本集與所述正樣本集的樣本數量差大于預設閾值,則對所述正樣本集中的樣本進行分析,以合成新樣本并將所述新樣本添加至所述正樣本集中,以構建新的正樣本集。
8.一種用戶篩選裝置,其特征在于,包括:
數據獲取模塊,用于獲取待識別用戶的線下圖像數據和線上數據,所述線下圖像數據包括拜訪記錄圖像;
圖像處理模塊,用于對所述拜訪記錄圖像進行圖像處理,以得到所述待識別用戶的線下拜訪數據;
特征衍生模塊,用于將所述線下拜訪數據和線上數據作為所述待識別用戶的基礎數據,并對所述基礎數據進行特征衍生以得到所述待識別用戶的特征數據;
特征匹配模塊,用于根據預先訓練的用戶識別模型對所述待識別用戶的特征數據進行特征因子匹配,所述預先訓練的用戶識別模型用于識別出目標用戶的特征因子;
用戶確定模塊,用于當所述待識別用戶的特征數據與所述用戶識別模型中的特征因子的匹配度滿足預設條件時,確定所述待識別用戶為目標用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010144416.6/1.html,轉載請聲明來源鉆瓜專利網。





