[發(fā)明專利]構(gòu)建用戶畫像標(biāo)簽的方法及其系統(tǒng)有效
| 申請?zhí)枺?/td> | 201910816219.1 | 申請日: | 2019-08-30 |
| 公開(公告)號: | CN110674178B | 公開(公告)日: | 2023-09-05 |
| 發(fā)明(設(shè)計)人: | 于興彬;溫億明 | 申請(專利權(quán))人: | 創(chuàng)新先進(jìn)技術(shù)有限公司 |
| 主分類號: | G06F16/2457 | 分類號: | G06F16/2457 |
| 代理公司: | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 11315 | 代理人: | 許振新;朱文杰 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 構(gòu)建 用戶 畫像 標(biāo)簽 方法 及其 系統(tǒng) | ||
本申請公開了一種構(gòu)建用戶畫像標(biāo)簽的方法及其系統(tǒng)。該方法包括:獲取包括多個用戶特征的用戶特征庫;獲取被預(yù)先標(biāo)定用戶畫像標(biāo)簽的樣本數(shù)據(jù)的樣本集合,根據(jù)樣本集合中的樣本數(shù)據(jù)計算用戶特征的穩(wěn)定性指標(biāo)和有效性指標(biāo);根據(jù)穩(wěn)定性指標(biāo)和有效性指標(biāo)從用戶特征庫中選擇N個用戶特征;使用樣本集合中樣本數(shù)據(jù)的N個用戶特征在機(jī)器學(xué)習(xí)模型中進(jìn)行有監(jiān)督訓(xùn)練;將非樣本數(shù)據(jù)的N個用戶特征輸入訓(xùn)練好的機(jī)器學(xué)習(xí)模型,機(jī)器學(xué)習(xí)模型輸出非樣本數(shù)據(jù)的用戶畫像標(biāo)簽。
技術(shù)領(lǐng)域
本說明書涉及大數(shù)據(jù)技術(shù)領(lǐng)域。
背景技術(shù)
用戶畫像是通過數(shù)據(jù)對用戶進(jìn)行精準(zhǔn)的刻畫,包括用戶的基本信息、社會屬性、行為信息、關(guān)系信息、地理位置信息等。一個用戶畫像包括多個用戶畫像標(biāo)簽(本說明書中有時簡稱為標(biāo)簽)。標(biāo)簽的例子包括:年齡段,性別,是否有房,是否有車,是否有孩子等。例如,一個用戶的用戶畫像可以包括以下標(biāo)簽:35-40歲、男性、有房、無車、有孩子。
用戶畫像是互聯(lián)網(wǎng)公司的基礎(chǔ)數(shù)據(jù)資產(chǎn),是營銷、風(fēng)控等業(yè)務(wù)的數(shù)據(jù)底盤。用戶畫像一般包括成百上千的標(biāo)簽,傳統(tǒng)的用戶畫像標(biāo)簽通過人工一個一個開發(fā),比較耗時耗力,如何批量快速構(gòu)建用戶畫像標(biāo)簽是互聯(lián)網(wǎng)公司面臨的重要問題。
發(fā)明內(nèi)容
本說明書提供了一種構(gòu)建用戶畫像標(biāo)簽的方法及其系統(tǒng),可以批量自動地快速構(gòu)建用戶畫像標(biāo)簽。
本申請公開了一種構(gòu)建用戶畫像標(biāo)簽的方法,包括:
獲取包括多個用戶特征的用戶特征庫;
獲取被預(yù)先標(biāo)定用戶畫像標(biāo)簽的樣本數(shù)據(jù)的樣本集合,根據(jù)所述樣本集合中的樣本數(shù)據(jù)計算所述用戶特征的穩(wěn)定性指標(biāo)和有效性指標(biāo);
根據(jù)所述穩(wěn)定性指標(biāo)和所述有效性指標(biāo)從所述用戶特征庫中選擇N個用戶特征,其中N為大于1的整數(shù);
使用所述樣本集合中樣本數(shù)據(jù)的所述N個用戶特征在機(jī)器學(xué)習(xí)模型中進(jìn)行有監(jiān)督訓(xùn)練;
將非樣本數(shù)據(jù)的所述N個用戶特征輸入訓(xùn)練好的所述機(jī)器學(xué)習(xí)模型,所述機(jī)器學(xué)習(xí)模型輸出所述非樣本數(shù)據(jù)的用戶畫像標(biāo)簽。
在一個優(yōu)選例中,所述穩(wěn)定性指標(biāo)為群體穩(wěn)定性指標(biāo),所述有效性指標(biāo)為信息價值。
在一個優(yōu)選例中,所述根據(jù)所述穩(wěn)定性指標(biāo)和所述有效性指標(biāo)從所述用戶特征庫中選擇N個用戶特征,進(jìn)一步包括:
從所述用戶特征庫的用戶特征中選擇群體穩(wěn)定性指標(biāo)值大于預(yù)定門限且信息價值的值排名前N的用戶特征。
在一個優(yōu)選例中,所述使用所述樣本集合中樣本數(shù)據(jù)的所述N個用戶特征在機(jī)器學(xué)習(xí)模型中進(jìn)行有監(jiān)督訓(xùn)練,包括:
預(yù)先為所述機(jī)器學(xué)習(xí)模型的至少一個超參數(shù)設(shè)置多個選項(xiàng);
根據(jù)所述多個選項(xiàng)建立超參數(shù)不同的多個機(jī)器學(xué)習(xí)模型;
將所述樣本集合中樣本數(shù)據(jù)的所述N個用戶特征和標(biāo)簽分別輸入到所述多個機(jī)器學(xué)習(xí)模型中進(jìn)行有監(jiān)督訓(xùn)練;
從所述多個機(jī)器學(xué)習(xí)模型中選擇一個訓(xùn)練效果最好的,作為最終使用的機(jī)器學(xué)習(xí)模型。
在一個優(yōu)選例中,所述機(jī)器學(xué)習(xí)模型是包括以下任一:隨機(jī)森林模型、xgboost、lightGBM、深度神經(jīng)網(wǎng)絡(luò)模型。
在一個優(yōu)選例中,所述用戶特征庫中的用戶特征是根據(jù)歷史累積的業(yè)務(wù)數(shù)據(jù)預(yù)先構(gòu)建的通用用戶特征。
在一個優(yōu)選例中,構(gòu)建多個不同的用戶畫像標(biāo)簽時使用同一個所述用戶特征庫。
本申請還公開了一種構(gòu)建用戶畫像標(biāo)簽的系統(tǒng)包括:
存儲用戶特征庫的存儲器,該用戶特征庫包括多個用戶特征;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于創(chuàng)新先進(jìn)技術(shù)有限公司,未經(jīng)創(chuàng)新先進(jìn)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910816219.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法
- 用戶畫像標(biāo)簽查詢方法、設(shè)備及計算機(jī)可讀存儲介質(zhì)
- 廣告投放方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 一種主體畫像生成的方法、裝置和存儲介質(zhì)
- 基于流平臺的智能全景客戶畫像聯(lián)動方法及系統(tǒng)
- 畫像構(gòu)建方法、裝置、設(shè)備及存儲介質(zhì)
- 畫像構(gòu)建方法、裝置、終端及存儲介質(zhì)
- 一種適用于城市軌道交通的乘客畫像系統(tǒng)及其構(gòu)建方法
- 用戶畫像方法、裝置、計算機(jī)可讀存儲介質(zhì)及終端設(shè)備
- 一種跨境場景畫像構(gòu)建方法和裝置
- 一種用戶畫像方法與裝置
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹形結(jié)構(gòu)的標(biāo)簽存儲方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





