[發明專利]一種跨社交網絡用戶身份匹配的方法在審
| 申請號: | 202111505497.9 | 申請日: | 2021-12-10 |
| 公開(公告)號: | CN114169449A | 公開(公告)日: | 2022-03-11 |
| 發明(設計)人: | 張毅超;楊鑰;劉甜甜;關佶紅;李文根;周水庚 | 申請(專利權)人: | 同濟大學;復旦大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 上海德昭知識產權代理有限公司 31204 | 代理人: | 郁旦蓉 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 網絡 用戶 身份 匹配 方法 | ||
1.一種跨社交網絡用戶身份匹配的方法,其特征在于,包括以下步驟:
步驟S1,利用兩個社交網絡數據對已知用戶名數據進行匹配,將每一對匹配的用戶名數據用空格連接起來,得到正樣本對,再打亂所述兩個社交網絡數據對所對應的用戶名順序,隨機抽取數據并得到負樣本對,所述正樣本對數量和所述負樣本對數量相等,構成用戶名樣本對數據集;
步驟S2,利用字母表對所述用戶名樣本對數據集中的每一個用戶名樣本對進行向量化表示,得到所述樣本對訓練數據集;
步驟S3,構建用戶身份匹配網絡模型;
步驟S4,將所述樣本對訓練數據集輸入到所述用戶身份匹配網絡模型,利用交叉熵損失函數loss(x,class)進行監督訓練,當訓練次數滿足結束條件,得到訓練完成的用戶身份匹配網絡模型;
步驟S5,將兩個待測用戶名數據進行配對,得到待測樣本對數據;
步驟S6,將所述待測樣本對數據輸入到所述訓練完成的用戶身份匹配網絡模型,得到用戶名匹配結果,
其中,所述用戶身份匹配網絡模型為卷積神經網絡模型,包括輸入層、隱含層和輸出層,
所述輸出層包括softmax分類器和多個全連接層,每兩個所述全連接層之間有dropout層。
2.根據權利要求1所述的一種跨社交網絡用戶身份匹配的方法,其特征在于:
其中,所述交叉熵損失函數loss(x,class)的具體表達式為:
式中,x[class]表示樣本的標簽,x[j]表示所述樣本對數據j的匹配結果為正的概率。
3.根據權利要求1所述的一種跨社交網絡用戶身份匹配的方法,其特征在于:
其中,所述隱含層包括多個卷積層,多個池化層,
所述輸出層包括三個所述全連接層,兩個所述dropout層分別在所述三個全連接層的兩兩之間。
4.根據權利要求3所述的一種跨社交網絡用戶身份匹配的方法,其特征在于:
其中,所述卷積層的計算公式為:
式中,Mij表示輸入層與濾波器相對應的矩陣元素值輸入的矩陣元,Fij表示卷積層輸出后的特征圖矩陣元,Kij表示窗口大小為n×n的濾波器,b表示偏置值,α表示卷積層的激活函數。
5.根據權利要求3所述的一種跨社交網絡用戶身份匹配的方法,其特征在于:
其中,所述池化層的計算公式為:
式中,WCNN和bCNN為訓練的參數,T表示轉置運算,ke為卷積核的大小,max1≤j≤l表示最大池化操作,l為所述樣本對訓練數據集中的數據特征向量的長度,為每一個所述用戶名樣本對生成的向量,ec()為每一個所述用戶樣本對中的詞的嵌入向量,為每個字符的嵌入向量。
6.根據權利要求5所述的一種跨社交網絡用戶身份匹配的方法,其特征在于:
其中,所述全連接層的計算公式為:
z=WTew+b
式中,z為所述全連接層的輸出,W表示全連接層的權重,ew表示樣本通過所述卷積神經網絡模型得到的嵌入向量表示,b表示偏置項。
7.根據權利要求5所述的一種跨社交網絡用戶身份匹配的方法,其特征在于:
其中,所述的softmax分類器的計算公式為:
式中,softmax(zi)為輸出用戶身份匹配概率,C為維度,為某一個樣本對通過全連接層的輸出向量,為所有樣本對通過全連接層的輸出向量。
8.根據權利要求1所述的一種跨社交網絡用戶身份匹配的方法,其特征在于:
其中,所述訓練結束條件是訓練次數達到預定迭代次數或者所述用戶身份匹配網絡模型的損失值收斂到預定閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學;復旦大學,未經同濟大學;復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111505497.9/1.html,轉載請聲明來源鉆瓜專利網。





