[發明專利]一種具有關聯關系的用戶挖掘方法、裝置及電子設備在審
| 申請號: | 201810469344.5 | 申請日: | 2018-05-16 |
| 公開(公告)號: | CN108763359A | 公開(公告)日: | 2018-11-06 |
| 發明(設計)人: | 王璐;張文明;陳少杰 | 申請(專利權)人: | 武漢斗魚網絡科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 430070 湖北省武漢市武漢東湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 從屬關系 關聯關系 裝置及電子設備 鄰居關系 用戶挖掘 互聯網協議 迭代算法 同一設備 網上行為 用戶確定 用戶團體 時間段 挖掘 | ||
1.一種具有關聯關系的用戶挖掘方法,其特征在于,包括:
將在設定時間段內基于同一設備和/或相同互聯網協議IP地址進行特定網上行為的用戶確定為具有鄰居關系的用戶;
基于迭代算法確定所述具有鄰居關系的用戶中具有從屬關系的用戶;
根據所述具有從屬關系的用戶的確定結果,確定具有團體關系的所有用戶。
2.根據權利要求1所述的方法,其特征在于,所述基于迭代算法確定所述具有鄰居關系的用戶中具有從屬關系的用戶,包括:
為每個用戶確定用于標識對應用戶的標簽;
使用每個用戶的標簽基于迭代算法計算每個用戶與其鄰居用戶之間的從屬概率,并在每個用戶與其鄰居用戶之間的從屬概率保持不變時停止迭代;
根據每個用戶與其鄰居用戶之間的從屬概率確定具有鄰居關系的用戶中具有從屬關系的用戶。
3.根據權利要求2所述的方法,其特征在于,所述使用每個用戶的標簽基于迭代算法計算每個用戶與其鄰居用戶之間的從屬概率,包括:
按照如下公式計算在第k次迭代時用戶x與其鄰居用戶c之間的從屬概率pk(c,x):
其中,N(x)表示用戶x的鄰居用戶組成的集合,|N(x)|表示用戶x的鄰居用戶的數量,y表示用戶x的鄰居用戶,pk-1(c,y)表示在第k-1次迭代時,用戶y與用戶c之間的從屬概率。
4.根據權利要求3所述的方法,其特征在于,所述使用每個用戶的標簽基于迭代算法計算每個用戶與其鄰居用戶之間的從屬概率,還包括:
每次迭代時,若用戶x與其鄰居用戶c之間的從屬概率pk(c,x)均大于等于保留閾值,則保留當前次迭代中的從屬概率pk(c,x);
若只有部分pk(c,x)大于等于保留閾值,則對用戶x與其鄰居用戶c之間的從屬概率pk(c,x)進行歸一化處理;
若所有的pk(c,x)都小于保留閾值,則從N(x)中隨機挑選用戶c0且設置用戶x與其鄰居用戶c0之間的從屬概率pk(c0,x)為1,并將pk(c0,x)作為用戶x的當前次迭代結果。
5.根據權利要求4所述的方法,其特征在于,在第k次迭代中,使用如下歸一化公式對用戶x與其鄰居用戶c之間的從屬概率進行歸一化處理:
其中,pk′(c,x)表示在第k次迭代中歸一化之后用戶x與其鄰居用戶c之間的從屬概率,N(x)表示用戶x的鄰居用戶組成的集合,pk(c,x)表示在第k次迭代時歸一化之前用戶x與其鄰居用戶c之間的從屬概率,I(pk(c,x)≥1/v)是示性函數,若pk(c,x)≥1/v,則I(pk(c,x)≥1/v)取1,否則取0,1/v表示保留閾值。
6.根據權利要求2-5中任一項所述的方法,其特征在于,所述根據所述具有從屬關系的用戶的確定結果,確定具有團體關系的所有用戶,包括:
將與相同用戶具有從屬關系的用戶確定為具有團體關系的用戶。
7.根據權利要求1-5中任一項所述的方法,其特征在于,所述特定網上行為,包括:通過直播平臺針對相同的主播進行刷彈幕行為和/或通過直播平臺針對相同的主播進行刷關注行為。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢斗魚網絡科技有限公司,未經武漢斗魚網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810469344.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據校驗方法及裝置
- 下一篇:一種分類方法及裝置、計算機可讀存儲介質





