[發明專利]一種無監督的跨平臺用戶身份關聯方法在審
| 申請號: | 202110983442.2 | 申請日: | 2021-08-25 |
| 公開(公告)號: | CN113673615A | 公開(公告)日: | 2021-11-19 |
| 發明(設計)人: | 薄偉 | 申請(專利權)人: | 上海頌藝信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/16;G06N3/04 |
| 代理公司: | 天津鉑茂專利代理事務所(普通合伙) 12241 | 代理人: | 張天翔 |
| 地址: | 201800 上海市嘉定區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 監督 平臺 用戶 身份 關聯 方法 | ||
本發明公開了一種無監督的跨平臺用戶身份關聯方法,包括以下步驟:獲取源網絡和目標網絡的表征圖和然后通過一個共享編碼器對源網絡和目標網絡的表征圖進行表征學習,獲取源網絡和目標網絡的表征圖各自初始的節點特征Zs和Zt;根據獲取的節點表征Zs和Zt重構源網絡的鄰接矩陣和屬性矩陣,并根據鄰接矩陣和屬性矩陣與原網絡對比計算獲取整體模型關于網絡重構部分的損失函數,引入對抗訓練模型。本發明中,利用自動編碼器對源網絡和目標網絡進行表征學習,再利用鑒別器鑒別輸入樣本的真偽,最終通過訓練得到的節點表征計算用戶節點之間對齊的可能性。
技術領域
本發明涉及跨平臺用戶身份關聯技術領域,尤其涉及一種無監督的跨平臺用戶身份關聯方法。
背景技術
在現實生活中,已知錨鏈通常難以獲得,在錨鏈缺失或數量較少的情況下此類半監督或有監督方法不再適用,因此提出無監督跨平臺用戶身份關聯方法,首先利用自動編碼器對源網絡和目標網絡進行表征學習,再利用鑒別器鑒別輸入樣本的真偽,最終通過訓練得到的節點表征計算用戶節點之間對齊的可能性。
發明內容
本發明的目的在于提供一種無監督的跨平臺用戶身份關聯方法,利用自動編碼器對源網絡和目標網絡進行表征學習,再利用鑒別器鑒別輸入樣本的真偽,最終通過訓練得到的節點表征計算用戶節點之間對齊的可能性。
為了實現上述目的,本發明采用了如下技術方案:一種無監督的跨平臺用戶身份關聯方法,包括以下步驟:
S1:獲取源網絡和目標網絡的表征圖和然后通過一個共享編碼器對源網絡和目標網絡的表征圖進行表征學習,獲取源網絡和目標網絡的表征圖各自初始的節點特征Zs和Zt;
S2:根據獲取的節點表征Zs和Zt重構源網絡的鄰接矩陣和屬性矩陣,并根據鄰接矩陣和屬性矩陣與原網絡對比計算獲取整體模型關于網絡重構部分的損失函數,引入對抗訓練模型;
S3:在對抗訓練模型末端設置一個有多層感知機構構成的鑒別器D,將Zt作為虛假的節點表征,將Zs作為真實節點表征訓練鑒別器D,使鑒別器D能夠將Zs和Zt區分開;
S4:通過鑒別器D鑒別來源于不同網絡的節點表征,最終得到分布非常相近的節點表征向量,進而計算余弦距離判斷相似度完成關聯匹配。
作為上述技術方案的進一步描述:
所述源網絡和目標網絡的表征圖和其中,Xs分別代表圖Gs的邊、點幾何以及用戶屬性矩陣。
作為上述技術方案的進一步描述:
所述共享編碼器對源網絡和目標網絡的表征圖進行表征學習,其中,采用圖卷積神經網絡作為共享編碼器,獲取源網絡和目標網絡的表征圖各自初始的節點特征Zs和Zt具體計算方式為:
其中,W(l)是共享GCN的權重矩陣,Rs,Rt分別為和的度矩陣,采用圖卷積神經網絡作為共享編碼器。
作為上述技術方案的進一步描述:
所述步驟S2中根據鄰接矩陣和屬性矩陣與原網絡對比計算獲取整體模型關于網絡重構部分的損失函數具體包括以下步驟:
S2.1:分別使用節點表征向量的內積和全連接層來重構原有網絡的結構信息和屬性信息,并利用重構得到的鄰接矩陣和屬性矩陣與原網絡對比得到損失函數:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海頌藝信息科技有限公司,未經上海頌藝信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110983442.2/2.html,轉載請聲明來源鉆瓜專利網。





