[發(fā)明專利]一種基于用戶群微細分的信息推送方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010845957.1 | 申請日: | 2020-08-21 |
| 公開(公告)號: | CN111738812B | 公開(公告)日: | 2020-12-08 |
| 發(fā)明(設(shè)計)人: | 張磊;藺靜茹;曹新建;邵俊 | 申請(專利權(quán))人: | 深圳索信達數(shù)據(jù)技術(shù)有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06Q30/02;H04L29/08 |
| 代理公司: | 北京市隆安律師事務(wù)所 11323 | 代理人: | 楊云 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 微細 信息 推送 方法 系統(tǒng) | ||
1.一種基于用戶群微細分的信息推送方法,其特征在于,包括以下步驟:
從服務(wù)器獲取用戶信息及其對應(yīng)的產(chǎn)品信息;
對所述用戶信息及其對應(yīng)的產(chǎn)品信息進行標準化處理,得到第一數(shù)據(jù)集;
對所述第一數(shù)據(jù)集進行結(jié)構(gòu)引力成像處理,將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為二維彩色等高線輪廓圖;
從所述二維彩色等高線輪廓圖中提取低維特征向量;
根據(jù)所述低維特征向量采用密度聚類的方法對用戶群進行微細分以形成用戶微細分簇群;
將所述低維特征向量及用戶微細分簇群的提升度用于優(yōu)先推薦模型的優(yōu)化提升;
基于所述優(yōu)先推薦模型的預(yù)測結(jié)果向用戶群進行相應(yīng)產(chǎn)品的信息推送;
對所述第一數(shù)據(jù)集進行結(jié)構(gòu)引力成像處理,將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為二維彩色等高線輪廓圖,從所述二維彩色等高線輪廓圖中提取低維特征向量,包括:
根據(jù)全體用戶的分箱離散化編碼,進行相關(guān)分析,計算相關(guān)系數(shù)矩陣,將相關(guān)系數(shù)轉(zhuǎn)化為變量間的引力;
根據(jù)全體用戶的各個產(chǎn)品購買金額匯總占比和相關(guān)系數(shù)矩陣,映射為星系中的星球大小和星際引力,應(yīng)用斥力算法通過迭代得到星系穩(wěn)定后各星球的空間坐標;
根據(jù)穩(wěn)定后的產(chǎn)品星球大小和空間位置,將星球大小映射為山峰海拔高度,并對二維網(wǎng)格中的大量缺失值進行插值填充,構(gòu)建三維地形圖;
根據(jù)三維地形圖,進行等高線投影,并基于海拔高度的不同進行不同染色,構(gòu)建二維彩色等高線輪廓圖;
根據(jù)全體用戶對應(yīng)的大量二維彩色等高線輪廓圖,通過自動編碼器訓練建模,以抽取二維彩色等高線輪廓圖的低維特征向量,并建立分箱離散化編碼和低維特征向量的映射表。
2.如權(quán)利要求1所述的方法,其特征在于,其中所述產(chǎn)品信息包括針對所述產(chǎn)品的用戶的歷史行為數(shù)據(jù)。
3.如權(quán)利要求1所述的方法,其特征在于,其中對所述用戶信息及其對應(yīng)的產(chǎn)品信息進行標準化處理,得到第一數(shù)據(jù)集,包括:
將所述用戶信息及其對應(yīng)的產(chǎn)品信息標準化處理為用戶與產(chǎn)品的月日均數(shù)據(jù)寬表;
根據(jù)全體用戶與各產(chǎn)品的數(shù)據(jù)分布,進行零值歸并二次分箱離散化,通過百分位數(shù)分箱、零值歸并、十分位數(shù)分箱,將各項數(shù)據(jù)離散化為十個分箱標簽,并以箱體中位數(shù)作為分箱量化值;
所述零值歸并二次分箱離散化標簽的計算公式為:
其中n為全體用戶數(shù)量
式中,為第i個百分位數(shù)的位置,為第j個十分位數(shù)的位置,i和j分別表示第i和第j個分位數(shù);
根據(jù)用戶在各產(chǎn)品資產(chǎn)占比的分箱標簽,串聯(lián)形成用戶的分箱離散化編碼,形成第一數(shù)據(jù)集。
4.如權(quán)利要求1所述的方法,其特征在于,其中所述根據(jù)所述低維特征向量采用密度聚類的方法對用戶群進行微細分以形成用戶微細分簇群,包括:
根據(jù)分箱離散化編碼的頻數(shù)統(tǒng)計和低維特征向量映射表,通過頻數(shù)加權(quán)還原全體用戶的低維特征向量數(shù)據(jù);
根據(jù)全體用戶的低維特征向量數(shù)據(jù),通過基于密度的聚類算法,進行聚類;
將聚類結(jié)果中的所有簇群和未形成簇群的離群點進行合并,形成最終的微細分簇群集合,以微細分簇群中心點的分箱離散化編碼作為該微細分簇群的分箱離散化編碼。
5.如權(quán)利要求4所述的方法,其特征在于,其中將所述低維特征向量及用戶微細分簇群的提升度用于優(yōu)先推薦模型的優(yōu)化提升,包括:
將每個用戶的低維特征向量作為新的特征變量,加入到現(xiàn)有各個優(yōu)先推薦模型的寬表之中,重新訓練原有預(yù)測模型,以得到各個產(chǎn)品對應(yīng)的第一優(yōu)先推薦模型;
計算每個用戶微細分簇群中的陽性占比相對全體用戶陽性占比的提升度,將每個用戶對應(yīng)微細分簇群的提升度作為新的特征變量,加入到現(xiàn)有各個產(chǎn)品對應(yīng)的第一優(yōu)先推薦模型的寬表之中,訓練該第一優(yōu)先推薦模型,以得到優(yōu)化后的優(yōu)先推薦模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳索信達數(shù)據(jù)技術(shù)有限公司,未經(jīng)深圳索信達數(shù)據(jù)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010845957.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





