[發(fā)明專利]融合用戶多屬性信息的跨社交網(wǎng)絡(luò)用戶身份識別方法有效
| 申請?zhí)枺?/td> | 202010031369.4 | 申請日: | 2020-01-13 |
| 公開(公告)號: | CN111242218B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計(jì))人: | 邢玲;鄧凱凱;吳紅海;高建平;謝萍 | 申請(專利權(quán))人: | 河南科技大學(xué) |
| 主分類號: | G06F18/22 | 分類號: | G06F18/22;G06F18/2321;G06F18/25;G06F18/26;G06Q50/00;G06F16/951 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 溫利平;陳靚靚 |
| 地址: | 471000 河南*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 融合 用戶 屬性 信息 社交 網(wǎng)絡(luò) 身份 識別 方法 | ||
1.一種融合用戶多屬性信息的跨社交網(wǎng)絡(luò)用戶身份識別方法,其特征在于,包括以下步驟:
S1:當(dāng)需要對社交網(wǎng)絡(luò)A中的用戶識別其在社交網(wǎng)絡(luò)B中的相同賬號時(shí),分別從社交網(wǎng)絡(luò)A和社交網(wǎng)絡(luò)B中爬取各自用戶的顯示名稱、用戶好友網(wǎng)絡(luò)和歷史發(fā)布內(nèi)容,記兩個社交網(wǎng)絡(luò)中用戶數(shù)量分別為NA和NB;預(yù)先在兩個社交網(wǎng)絡(luò)中獲取已知屬于同一用戶的賬號對作為種子賬號對;
S2:從每個用戶的顯示名稱中提取出預(yù)設(shè)的C個特征屬性的數(shù)據(jù),然后計(jì)算社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j每個特征屬性的相似度c=1,2,…,C;
S3:從每個用戶的好友網(wǎng)絡(luò)中提取出預(yù)設(shè)的D個特征屬性的數(shù)據(jù),然后計(jì)算社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j每個特征屬性的相似度d=1,2,…,D;好友網(wǎng)絡(luò)的特征屬性包括好友關(guān)系、朋友圈、聚類系數(shù),其相似度計(jì)算方法分別如下:
社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的好友關(guān)系相似度的計(jì)算公式如下:
其中,表示社交網(wǎng)絡(luò)A中用戶i的第p跳鄰居節(jié)點(diǎn)集合和社交網(wǎng)絡(luò)B中用戶j的第q跳鄰居節(jié)點(diǎn)集合的好友關(guān)系相似度,p,q=1,2,…,P,P表示預(yù)設(shè)的跳數(shù),num()表示集合中的用戶數(shù)量;
社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的不同跳數(shù)的最大朋友圈相似度和最小朋友圈相似度計(jì)算公式如下:
其中,表示社交網(wǎng)絡(luò)A中用戶i的第p′跳最大朋友圈和社交網(wǎng)絡(luò)B中用戶j的第q跳最大朋友圈的好友關(guān)系相似度,表示社交網(wǎng)絡(luò)A中用戶i的第p′跳最小朋友圈和社交網(wǎng)絡(luò)B中用戶j的第q跳最小朋友圈的好友關(guān)系相似度;
聚類系數(shù)的相似度包括平均聚類系數(shù)差值相似度和平均聚類系數(shù)比值相似度,其中社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的平均聚類系數(shù)差值相似度的計(jì)算公式如下:
社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的平均聚類系數(shù)比值相似度的計(jì)算公式如下:
其中,ACA,i表示社交網(wǎng)絡(luò)A中用戶i的平均聚類系數(shù),ACB,j表示社交網(wǎng)絡(luò)B中用戶j的平均聚類系數(shù);平均聚類系數(shù)為用戶和其鄰居節(jié)點(diǎn)集合中所有用戶的聚類系數(shù)的平均值;
S4:從每個用戶的歷史發(fā)布內(nèi)容中提取出預(yù)設(shè)的E個特征屬性的數(shù)據(jù),然后計(jì)算社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j每個特征屬性的相似度e=1,2,…,E;歷史發(fā)布內(nèi)容的特征屬性包括文本信息特征、標(biāo)點(diǎn)符號特征和狀態(tài)時(shí)間戳特征,其相似度計(jì)算方法分別如下:
社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的文本信息特征相似度的計(jì)算公式如下:
其中,F(xiàn)表示頻繁項(xiàng),分別表示社交網(wǎng)絡(luò)A中用戶i和社交網(wǎng)絡(luò)B中用戶j對應(yīng)的頻繁項(xiàng)F的支持度計(jì)數(shù),CF表示頻繁項(xiàng)F的項(xiàng)集數(shù);
社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的標(biāo)點(diǎn)符號相似度的計(jì)算方法為:從社交網(wǎng)絡(luò)A中用戶i和社交網(wǎng)絡(luò)B中用戶j所發(fā)布的文本信息中統(tǒng)計(jì)得到每種標(biāo)點(diǎn)符號的使用次數(shù)與用戶所發(fā)布文本數(shù)量的比值,形成標(biāo)點(diǎn)符號向量,計(jì)算兩個向量之間的相似度即為標(biāo)點(diǎn)符號相似度
社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的時(shí)間狀態(tài)戳相似度的計(jì)算方法為:
將每天劃分為G個時(shí)間段,統(tǒng)計(jì)得到預(yù)設(shè)日期內(nèi)各個用戶在每個時(shí)間段的平均動態(tài)數(shù),采用以下公式計(jì)算社交網(wǎng)絡(luò)A中用戶i和社交網(wǎng)絡(luò)B中用戶j的時(shí)間狀態(tài)戳相似度:
其中,ViA(g)、分別表示社交網(wǎng)絡(luò)A中用戶i和社交網(wǎng)絡(luò)B中用戶j在第g個時(shí)間段的平均動態(tài)數(shù),||表示求取絕對值;
S5:設(shè)置C+D+E個權(quán)重,對步驟S2、S3和S4中計(jì)算得到的C+D+E個特征屬性相似度進(jìn)行加權(quán)求和,將求和值作為社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的匹配評分scorei,j:
S6:根據(jù)社交網(wǎng)絡(luò)A中各個用戶i和社交網(wǎng)絡(luò)B中各個用戶j的匹配評分scorei,j對兩個社交網(wǎng)絡(luò)中的用戶進(jìn)行匹配,從而得到用戶身份識別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河南科技大學(xué),未經(jīng)河南科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010031369.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種笛子批量聯(lián)動劃線裝置
- 下一篇:一種新能源電動汽車用電池箱
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





