[發明專利]一種旅行社用戶多維信息畫像的構建方法有效
| 申請號: | 201811154032.1 | 申請日: | 2018-09-30 |
| 公開(公告)號: | CN109408712B | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 劉德彬;陳瑋;黃遠江;劉建濤 | 申請(專利權)人: | 重慶譽存大數據科技有限公司;羅燦 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/06;G06Q50/14;G06K9/62 |
| 代理公司: | 重慶智慧之源知識產權代理事務所(普通合伙) 50234 | 代理人: | 余洪 |
| 地址: | 401121 重慶市渝北*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 旅行社 用戶 多維 信息 畫像 構建 方法 | ||
1.一種旅行社用戶多維信息畫像的構建方法,其特征在于,包括如下步驟:
S101、獲取樣本用戶原始數據,根據該原始數據對樣本用戶的特征和標簽進行分析和提取,獲得樣本用戶的特征向量和用戶畫像信息;
S102、為樣本用戶每個標簽分配權重;所述步驟S102中,采用布爾模型S-TFIWF對用戶標簽進行加權處理,得到用戶標簽權重的S-TW模型,具體計算如下:
其中,TW(w,d)為標簽w在用戶d中是否出現,出現為1,否則為0;N表示用戶數量,WT(w)表示用戶中出現該標簽的數量之和,P表示所有用戶消費總金額,T表示某個標簽的用戶群的消費總金額,T/P表示某個標簽的用戶群的消費總金額與所有用戶消費總金額之比;
S103、設置需要聚類的簇的個數k和相似度閾值θ;
S104、根據樣本用戶的標簽向量,分別計算每兩個樣本用戶之間的相似度,生成相似度矩陣;
S105、根據相似度矩陣和相似度閾值θ,計算鄰居矩陣A;若兩個樣本用戶之間的相似度=θ,則該兩個樣本用戶之間互為鄰居,取值1,否則,該兩個樣本用戶之間不互為鄰居,取值0;
S106、根據每兩個樣本用戶之間的共同鄰居數量計算鏈接矩陣;
S107、根據鏈接矩陣和樣本用戶的標簽向量,計算每兩個樣本用戶的相似性度量,將相似性度量最高的兩個樣本用戶合并;
S108、利用目標函數以獲得最優的聚類結果;
S109、重復步驟S105~S108進行迭代,直至形成k個簇;
S110、利用標簽的平均值,為用戶畫像群劃分等級。
2.根據權利要求1所述的一種旅行社用戶多維信息畫像的構建方法,其特征在于,所述樣本用戶原始數據包括樣本用戶基本信息和樣本用戶旅游行為信息。
3.根據權利要求1所述的一種旅行社用戶多維信息畫像的構建方法,其特征在于,所述步驟S104中,采用修正余弦相似度算法計算樣本用戶之間的相似度。
4.根據權利要求1所述的一種旅行社用戶多維信息畫像的構建方法,其特征在于,所述步驟S107中,采用如下公式計算每兩個樣本用戶的相似性度量:
其中,Pq,Pr分別表示客戶q和r的標簽向量,link(Pq,Pr)表示客戶q和r的共同鄰居數,Ci為第i個簇,Cj為第j個簇,ni為Ci的大小(即樣本用戶的數量),nj為Cj的大小,f(θ)=(1-θ)/(1+θ),f(θ)具有以下性質:Ci中的每個樣本用戶在Ci中有nif(θ)個鄰居。
5.根據權利要求1所述的一種旅行社用戶多維信息畫像的構建方法,其特征在于,所述步驟S108中,所述目標函數公式如下:
其中,Pq,Pr分別表示客戶q和r的標簽向量,link(Pq,Pr)表示客戶q和r的共同鄰居數,k為族的個數,Ci為第i個簇,Cj為第j個簇,ni為Ci的大小(即樣本用戶的數量),nj為Cj的大小,f(θ)=(1-θ)/(1+θ),f(θ)具有以下性質:Ci中的每個樣本用戶在Ci中有nif(θ)個鄰居。
6.根據權利要求1所述的一種旅行社用戶多維信息畫像的構建方法,其特征在于,所述步驟S110中,所述等級劃分計算方法如下:
設Ti為用戶畫像群中第i個標簽的平均值,其權重為Wi,客戶畫像群的等級計算公式如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶譽存大數據科技有限公司;羅燦,未經重慶譽存大數據科技有限公司;羅燦許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811154032.1/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





