[發(fā)明專利]一種用戶團(tuán)體識別方法、裝置、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910431373.7 | 申請日: | 2019-05-22 |
| 公開(公告)號: | CN110177094B | 公開(公告)日: | 2021-11-09 |
| 發(fā)明(設(shè)計(jì))人: | 王璐 | 申請(專利權(quán))人: | 武漢斗魚網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L29/08;H04L12/26;G06F16/906 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 430070 湖北省武漢市武漢東湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用戶 團(tuán)體 識別 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種用戶團(tuán)體識別方法,其特征在于,包括:
根據(jù)用戶的特定網(wǎng)上行為構(gòu)建用戶關(guān)系圖;
基于用戶在設(shè)定時(shí)間段內(nèi)發(fā)生特定網(wǎng)上行為的次數(shù),計(jì)算所述用戶關(guān)系圖中每兩個(gè)用戶之間的行為相似度;
根據(jù)所述行為相似度對所述用戶關(guān)系圖進(jìn)行裁剪,以刪除行為相似度低于設(shè)定閾值的用戶之間的關(guān)聯(lián)關(guān)系;
根據(jù)用戶進(jìn)行網(wǎng)上行為時(shí)所使用的終端設(shè)備數(shù)量以及互聯(lián)網(wǎng)協(xié)議IP地址數(shù)量,基于裁剪后的用戶關(guān)系圖對目標(biāo)用戶團(tuán)體進(jìn)行識別;
所述基于用戶在設(shè)定時(shí)間段內(nèi)發(fā)生特定網(wǎng)上行為的次數(shù),計(jì)算所述用戶關(guān)系圖中每兩個(gè)用戶之間的行為相似度,包括:
按照如下公式計(jì)算所述每兩個(gè)用戶之間的行為相似度:
其中,sim(u,v)表示用戶u與用戶v之間的行為相似度,ui表示用戶u在時(shí)間段Ti內(nèi)發(fā)生特定網(wǎng)上行為的次數(shù),vi表示用戶i在時(shí)間段Ti內(nèi)發(fā)生特定網(wǎng)上行為的次數(shù),n表示設(shè)定時(shí)間段T包括的時(shí)間段Ti的個(gè)數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)用戶的特定網(wǎng)上行為構(gòu)建用戶關(guān)系圖,包括:
確定在設(shè)定時(shí)間段內(nèi)進(jìn)行特定網(wǎng)上行為的所有用戶;
將所述所有用戶中的每個(gè)用戶作為一個(gè)頂點(diǎn);
將在設(shè)定時(shí)間段內(nèi)基于相同終端設(shè)備和/或相同IP地址進(jìn)行所述特定網(wǎng)上行為的用戶對應(yīng)的頂點(diǎn)通過邊線進(jìn)行連接,生成無向的用戶關(guān)系圖。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述行為相似度對所述用戶關(guān)系圖進(jìn)行裁剪,以刪除行為相似度低于設(shè)定閾值的用戶之間的關(guān)聯(lián)關(guān)系,包括:
將行為相似度低于設(shè)定閾值的兩用戶對應(yīng)的頂點(diǎn)之間的邊線刪除。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,根據(jù)用戶進(jìn)行網(wǎng)上行為時(shí)所使用的終端設(shè)備數(shù)量以及互聯(lián)網(wǎng)協(xié)議IP地址數(shù)量基于裁剪后的用戶關(guān)系圖對目標(biāo)用戶團(tuán)體進(jìn)行識別,包括:
通過連通圖聚類的方式基于所述裁剪后的用戶關(guān)系圖得到各待識別用戶團(tuán)體;
根據(jù)用戶進(jìn)行網(wǎng)上行為時(shí)所使用的終端設(shè)備數(shù)量以及互聯(lián)網(wǎng)協(xié)議IP地址數(shù)量分別計(jì)算各待識別用戶團(tuán)體為目標(biāo)用戶團(tuán)體的置信度;
將置信度達(dá)到閾值的待識別用戶團(tuán)體確定為目標(biāo)用戶團(tuán)體。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)用戶進(jìn)行網(wǎng)上行為時(shí)所使用的終端設(shè)備數(shù)量以及互聯(lián)網(wǎng)協(xié)議IP地址數(shù)量分別計(jì)算各待識別用戶團(tuán)體為目標(biāo)用戶團(tuán)體的置信度,包括:
按照如下公式計(jì)算待識別用戶團(tuán)體為目標(biāo)用戶團(tuán)體的置信度:
其中,F(xiàn)(G)表示待識別用戶團(tuán)體G為目標(biāo)用戶團(tuán)體的置信度,|G|表示待識別用戶團(tuán)體G包括的用戶成員數(shù),IP(G)表示待識別用戶團(tuán)體G中所有用戶成員在設(shè)定時(shí)間段內(nèi)發(fā)生特定網(wǎng)上行為時(shí)所使用的IP地址總數(shù),Device(G)表示待識別用戶團(tuán)體G中所有用戶成員在設(shè)定時(shí)間段內(nèi)發(fā)生特定網(wǎng)上行為時(shí)所使用的終端設(shè)備總數(shù),Edge(G)表示待識別用戶團(tuán)體G在所述裁剪后的用戶關(guān)系圖中形成的邊的數(shù)量,w1、w2、w3是權(quán)重系數(shù),且w1+w2+w3=1。
6.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述特定網(wǎng)上行為包括登錄、簽到、發(fā)彈幕或者關(guān)注。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢斗魚網(wǎng)絡(luò)科技有限公司,未經(jīng)武漢斗魚網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910431373.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 識別網(wǎng)絡(luò)水軍團(tuán)體的方法及系統(tǒng)
- 跨團(tuán)體通訊錄的處理方法及裝置
- 跨團(tuán)體群組的管理方法及裝置
- 觸發(fā)共享交通工具團(tuán)體計(jì)費(fèi)規(guī)則的方法、用戶終端及系統(tǒng)
- 團(tuán)體信息的獲取方法及裝置、交互系統(tǒng)
- 一種基于團(tuán)體粒度的帶有預(yù)算約束的影響最大化優(yōu)化方法
- 跨團(tuán)體的數(shù)據(jù)共享方法及裝置
- 對象匹配的方法、裝置、設(shè)備及存儲介質(zhì)
- 團(tuán)體產(chǎn)品推薦方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 一種信用服務(wù)提供方法、裝置及設(shè)備





