[發明專利]基于用戶命名習慣映射學習的社交網絡賬號對齊方法及系統有效
| 申請號: | 202110291127.3 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN113127752B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 劉琰;趙媛;魏亮;郭曉宇;朱世杰;孫嫻 | 申請(專利權)人: | 中國人民解放軍戰略支援部隊信息工程大學 |
| 主分類號: | G06F16/9536 | 分類號: | G06F16/9536;G06F40/295;G06N3/044;G06N3/084;G06Q50/00 |
| 代理公司: | 鄭州大通專利商標代理有限公司 41111 | 代理人: | 周艷巧 |
| 地址: | 450000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 用戶 命名 習慣 映射 學習 社交 網絡 賬號 對齊 方法 系統 | ||
1.一種基于用戶命名習慣映射學習的社交網絡賬號對齊方法,其特征在于,包含如下內容:
從異構社交網絡中基于用戶名命名習慣提取網絡賬號特征,并將網絡賬號特征轉化為特征向量;
利用BP神經網絡將不同社交網絡用戶名特征向量進行映射;依據向量之間的距離差判定用戶名是否屬于同一個人,實現跨社交網絡的賬號對齊;
采用用戶命名模式從人類局限性、個體外在因素和個體內在因素三個方面提取網絡賬號特征;
人類局限性至少包含:相同用戶名、用戶名長度及唯一用戶名創建可能性;個體外在因素至少包含:鍵入的字母與前一個字母使用同一個手鍵入的占比、鍵入的字母與前一個字母使用同一個手指鍵入的占比、使用每個手指按手順序輸入的鍵的百分比及按在每行上的鍵的百分比;個體內在因素至少包含:字母分布、用戶名字母分布信息熵作為隨機程度的度量、最長公共子串、用于檢測縮寫的歸一化最長公共子序列長度、將字符串變成另一個字符串的編輯距離及通過集合中不同元素所占元素比例來衡量的樣本之間相似度;
設定三元組S={V,N,U}來表示社交網絡中的用戶名,其中,V為包含n個用戶的用戶集,且V={v1,v2,…,vn};N表示用戶名集合,每個用戶vi由d維特征向量ui表示,d維特征向量ui形成特征矩陣U,且U∈Rd×n,R為n個用戶的d維特征向量組成的集合;
對于源網絡社交網絡賬號集S和目標網絡社交賬號集T及部分對齊已知錨用戶對子集X,S={VS,NS,US},T={VT,NT,UT},利用BP神經網絡來最小化源網絡映射節點特征向量f(us)與目標網絡節點特征向量ub之間的距離,使映射的源網絡用戶名特征向量與目標網絡用戶名特征向量之間的距離最小,依據給定源網絡用戶vs與目標網絡中用戶vt的匹配地面距離d(f(us),ut)來實現源網絡和目標網絡不同社交網絡的用戶賬號對齊。
2.根據權利要求1所述的基于用戶命名習慣映射學習的社交網絡賬號對齊方法,其特征在于,利用已訓練的BP神經網絡將不同社交網絡用戶名特征向量進行映射,利用損失函數將特征向量分類問題轉化為向量之間的映射問題。
3.根據權利要求2所述的基于用戶命名習慣映射學習的社交網絡賬號對齊方法,其特征在于,BP神經網絡在訓練過程中,設定部分對齊的源網絡和目標網絡兩個異構社交網絡賬號集和已知錨用戶對子集,其中,錨用戶對是同時參與兩個社交網絡的同一個用戶的兩個賬號;利用兩個異構社交網絡賬號集和已知錨用戶對子集對BP神經網絡的映射函數進行學習,最小化源網絡映射節點向量與目標網絡節點向量之間距離,使兩個向量之間的距離小于設定閾值,且對于錨用戶對中匹配的賬號,使得映射的源網絡用戶名特征向量與目標網絡用戶名特征向量之間距離最小。
4.根據權利要求2或3所述的基于用戶命名習慣映射學習的社交網絡賬號對齊方法,其特征在于,損失函數計算中利用余弦相似性來計算向量之間的距離。
5.根據權利要求3所述的基于用戶命名習慣映射學習的社交網絡賬號對齊方法,其特征在于,映射學習過程中通過反向傳播算法訓練BP神經網絡參數,利用已知錨用戶對作為監督信息,通過梯度下降算法最小化損失函數。
6.根據權利要求3所述的基于用戶命名習慣映射學習的社交網絡賬號對齊方法,其特征在于,針對源網絡中的非錨用戶節點,將其向量輸入已訓練的BP神經網絡獲取映射向量,在目標網絡中尋找若干與映射向量最相似的節點來構造該非錨用戶節點的存在映射關系的用戶對。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍戰略支援部隊信息工程大學,未經中國人民解放軍戰略支援部隊信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110291127.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于高性能功率高效的可編程圖像處理的架構
- 下一篇:深海防腐涂料及其制備方法





