[發(fā)明專利]一種公司用戶畫像的生成方法在審
| 申請(qǐng)?zhí)枺?/td> | 201811622697.0 | 申請(qǐng)日: | 2018-12-28 |
| 公開(kāi)(公告)號(hào): | CN109710697A | 公開(kāi)(公告)日: | 2019-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 孫錦彬;吳承霖;周津 | 申請(qǐng)(專利權(quán))人: | 廈門笨鳥(niǎo)電子商務(wù)有限公司 |
| 主分類號(hào): | G06F16/27 | 分類號(hào): | G06F16/27;G06F16/215;G06F16/2458;G06F16/23 |
| 代理公司: | 廈門市新華專利商標(biāo)代理有限公司 35203 | 代理人: | 羅恒蘭 |
| 地址: | 361000 福建省廈門市思明區(qū)前埔*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 畫像 離線 公司用戶 數(shù)據(jù)同步 更新 用戶實(shí)時(shí)信息 串口 服務(wù)器壓力 定時(shí)更新 實(shí)時(shí)信息 數(shù)據(jù)干擾 算法預(yù)測(cè) 同步數(shù)據(jù) 統(tǒng)計(jì)數(shù)據(jù) 用戶行為 時(shí)效性 實(shí)時(shí)性 數(shù)據(jù)源 同步的 滑動(dòng) 發(fā)送 預(yù)測(cè) 統(tǒng)計(jì) 保證 | ||
1.一種公司用戶畫像的生成方法,其特征在于包括以下步驟:
步驟1、離線畫像
1-1數(shù)據(jù)同步:基于spark搭建畫像系統(tǒng),將用戶數(shù)據(jù)按照不同的業(yè)務(wù)需求存儲(chǔ)在多個(gè)數(shù)據(jù)源中;將各個(gè)數(shù)據(jù)源的數(shù)據(jù)同步一份到hdfs上,得到同步數(shù)據(jù),并定時(shí)進(jìn)行更新;
1-2數(shù)據(jù)清洗:將同步數(shù)據(jù)進(jìn)行清洗,去除臟數(shù)據(jù)以及缺失字段較多的數(shù)據(jù);
1-3數(shù)據(jù)統(tǒng)計(jì):將統(tǒng)計(jì)數(shù)據(jù)類型的畫像按照時(shí)間窗口劃分好進(jìn)行統(tǒng)計(jì),得到統(tǒng)計(jì)數(shù)據(jù);
1-4特征預(yù)測(cè):通過(guò)同步數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)和gbdt算法預(yù)測(cè)缺失的、抽象的深度特征;
1-5離線畫像存儲(chǔ):將1-3與1-4中生成的所有維度的特征進(jìn)行合并,通過(guò)hive存儲(chǔ)在hdsf中;
步驟2、實(shí)時(shí)畫像
2-1數(shù)據(jù)傳輸:畫像系統(tǒng)通過(guò)kafka將用戶的實(shí)時(shí)信息發(fā)送至spark streaming,根據(jù)用戶行為更新畫像;
2-2實(shí)時(shí)畫像生成:將每個(gè)窗口的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)并預(yù)測(cè),更新到用戶的畫像列表中。
2.如權(quán)利要求1所述的一種公司用戶畫像的生成方法,其特征在于:所述步驟1-1中,用戶數(shù)據(jù)包括用戶注冊(cè)的基本信息、按用戶需求設(shè)定的已建關(guān)鍵詞模型、用戶的歷史行為信息、用戶的客戶反饋信息。
3.如權(quán)利要求1所述的一種公司用戶畫像的生成方法,其特征在于:所述步驟1-1中,所述數(shù)據(jù)源包括mysql、mongo和es。
4.如權(quán)利要求1所述的一種公司用戶畫像的生成方法,其特征在于:所述步驟1-1中,更新時(shí)間為每日凌晨。
5.如權(quán)利要求1所述的一種公司用戶畫像的生成方法,其特征在于:所述步驟1-4中,深度特征包括例如興趣值、所屬行業(yè)和郵件點(diǎn)擊率。
6.如權(quán)利要求1所述的一種公司用戶畫像的生成方法,其特征在于:所述步驟2-1中,用戶的實(shí)時(shí)信息包括新用戶注冊(cè)的基本信息、新用戶注冊(cè)后設(shè)置的關(guān)鍵詞模型、用戶的實(shí)時(shí)行為信息、用戶的客戶反饋信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門笨鳥(niǎo)電子商務(wù)有限公司,未經(jīng)廈門笨鳥(niǎo)電子商務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811622697.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用戶畫像標(biāo)簽查詢方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 廣告投放方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種主體畫像生成的方法、裝置和存儲(chǔ)介質(zhì)
- 基于流平臺(tái)的智能全景客戶畫像聯(lián)動(dòng)方法及系統(tǒng)
- 畫像構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 畫像構(gòu)建方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種適用于城市軌道交通的乘客畫像系統(tǒng)及其構(gòu)建方法
- 用戶畫像方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備
- 一種跨境場(chǎng)景畫像構(gòu)建方法和裝置
- 一種用戶畫像方法與裝置
- 一種與移動(dòng)互聯(lián)網(wǎng)結(jié)合的校園遠(yuǎn)程控制系統(tǒng)
- 一種物流公司推薦方法和系統(tǒng)
- 用戶信息挖掘方法及裝置
- 基于博弈論的用戶與電力公司互動(dòng)方法
- 一種用于電子交易的顯示裝置
- 基于車聯(lián)網(wǎng)的汽車全生命周期服務(wù)平臺(tái)和服務(wù)方法
- 一種計(jì)及用戶需求響應(yīng)的售電公司購(gòu)電決策方法
- 涉及區(qū)塊鏈的公司營(yíng)業(yè)執(zhí)照溯源方法及其裝置
- 一種售電側(cè)放開(kāi)環(huán)境下電能質(zhì)量定價(jià)的優(yōu)化方法
- 基于用戶協(xié)助的銀行潛在對(duì)公客戶確定方法、裝置及設(shè)備
- 數(shù)據(jù)同步方法和數(shù)據(jù)同步系統(tǒng)
- 數(shù)據(jù)同步系統(tǒng)以及數(shù)據(jù)同步方法
- 數(shù)據(jù)同步方法與數(shù)據(jù)同步系統(tǒng)
- 數(shù)據(jù)同步系統(tǒng)及應(yīng)用數(shù)據(jù)同步系統(tǒng)的數(shù)據(jù)同步方法
- 數(shù)據(jù)同步裝置和數(shù)據(jù)同步方法
- 數(shù)據(jù)同步系統(tǒng)和數(shù)據(jù)同步方法
- 數(shù)據(jù)同步方法和數(shù)據(jù)同步系統(tǒng)
- 數(shù)據(jù)同步方法和數(shù)據(jù)同步系統(tǒng)
- 數(shù)據(jù)同步方法、數(shù)據(jù)同步裝置、數(shù)據(jù)同步設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)同步方法和數(shù)據(jù)同步裝置





