[發明專利]基于小樣本非均勻擴散算法的客戶數據篩選方法在審
| 申請號: | 201910048812.6 | 申請日: | 2019-01-18 |
| 公開(公告)號: | CN109919418A | 公開(公告)日: | 2019-06-21 |
| 發明(設計)人: | 施文凱 | 申請(專利權)人: | 上海九霄祥云網絡科技股份有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06F16/22;G06F16/2458 |
| 代理公司: | 上海驍象知識產權代理有限公司 31315 | 代理人: | 趙俊寅 |
| 地址: | 200433 上海市楊浦*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 擴散 客戶數據庫 客戶數據 非均勻 樣本點 算法 擴散方向 矢量 小樣本 篩選 字段 數據分析技術 控制點 矩陣 二維坐標系 變量因子 精準定位 客戶資料 篩選條件 子矩陣 聚合 剔除 期望 記錄 客戶 分析 | ||
一種基于小樣本非均勻擴散算法的客戶數據篩選方法,涉及數據分析技術領域,所解決的是精準定位客戶的技術問題。該方法先從客戶數據庫中選取兩個字段作為兩個擴散方向矢量,并選取一個字段作為擴散變量因子;再根據兩個擴散方向矢量建立二維坐標系;并采用非均勻擴散算法對客戶數據庫進行擴散,然后從擴散矩陣中選取一段滿足篩選條件的子矩陣,經聚合后得到樣本點集,再從客戶數據庫中任意選取多條記錄作為控制點集,并采用相關性估計期望公式對樣本點集進行分析,再根據相關性估計期望值剔除不合格的樣本點,最終得到客戶數據的篩選結果。本發明提供的方法,特別適用于基礎客戶資料較少的小微企業。
技術領域
本發明涉及數據分析的技術,特別是涉及一種基于小樣本非均勻擴散算法的客戶數據篩選方法的技術。
背景技術
小微企業往往由于無法獲取到足夠多的基礎客戶資料,從而難以實施對客戶的精準定位,進而影響到企業的運營。
發明內容
針對上述現有技術中存在的缺陷,本發明所要解決的技術問題是提供一種能在數據量較少的情況下實現客戶精準定位的基于小樣本非均勻擴散算法的客戶數據篩選方法。
為了解決上述技術問題,本發明所提供的一種基于小樣本非均勻擴散算法的客戶數據篩選方法,其特征在于,具體步驟如下:
1)構建客戶數據庫;
2)從客戶數據庫中選取兩個字段作為兩個擴散方向矢量,并選取一個字段作為擴散變量因子;
3)定義一個二維坐標系,該二維坐標系的橫軸為X軸,縱軸為Y軸,X軸與Y軸分別用于標示所選取的兩個擴散方向矢量;
設定一個X軸步長為h1,及一個Y軸步長為h2,按照h1、h2對二維坐標系進行網格劃分,使得每個網格的X軸長度為h1,Y軸長度為h2;
設定一個離散度步長τ,一個擴散步長限值C,一個初始值為1的擴散步數s,并采用非均勻擴散算法對客戶數據庫進行反復求解,每求解一次令擴散步數s的值增加1,直到擴散步數s的值達到設定的擴散步長限值C,從而得到一個擴散矩陣D;
非均勻擴散算法的方程式為:
式中,N為所選取的擴散變量因子,t=τ×s;
4)定義一個篩選條件,從擴散矩陣D中選取一段滿足篩選條件的子矩陣,并采用聚合函數對該子矩陣中的相似數據進行聚合,得到聚合后的樣本矩陣D1;
5)將樣本矩陣D1中的陣元作為樣本點集w,并從客戶數據庫中任意選取多條記錄作為控制點集v,并采用相關性估計期望公式對樣本點集w中的各個樣本點進行分析,相關性估計期望公式為:
其中,N為樣本點集w中的樣本點的總數量,wi為樣本點集w中的第i個樣本點,E(wi)為wi的相關性估計期望值,K(wi,v)為熱擴散方程,K(wi,v)中的代入樣本點為wi,K(wi,v)中的控制點集合為v;
6)預先設定一個容差閾值,將相關性估計期望值低于預設的容差閾值的樣本點從樣本點集w中剔除,將最終得到的樣本點集w作為客戶數據的篩選結果。
本發明提供的基于小樣本非均勻擴散算法的客戶數據篩選方法,采用基于小樣本非均勻擴散算法的預測模塊,以客戶數據為輸入項,經過過濾、擴散、去噪、聚合,得到一個仿真大樣本,再以仿真大樣本為輸入項進行有限元維度的統計分析,從而得到近似于大樣本數據的預測結果,能在數據量較少的情況下實現客戶精準定位。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海九霄祥云網絡科技股份有限公司,未經上海九霄祥云網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910048812.6/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





