[發明專利]一種模型訓練方法、數據獲取方法以及相關裝置有效
| 申請號: | 202010003044.5 | 申請日: | 2020-01-02 |
| 公開(公告)號: | CN111222563B | 公開(公告)日: | 2023-10-10 |
| 發明(設計)人: | 鐘文波;程明月 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06F18/22;G06F18/2411 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 方法 數據 獲取 以及 相關 裝置 | ||
本申請公開了一種模型訓練方法、數據獲取方法以及相關裝置,通過獲取多個訓練樣本;然后獲取每個訓練樣本中至少兩個標識碼分別指示的終端設備的行為信息;并根據該行為信息確定用于第一模型訓練的特征向量;進而將該特征向量輸入該第一模型,以得到用于指示至少兩個目標標識碼是否對應同一目標對象的第二模型。由于該第二模型基于多個行為信息進行了參數的訓練,其獲得的匹配結果不會受到偶發情況的影響,可以精確的進行標識碼之間對應關系的匹配,進而提高了用戶與標識碼關聯的準確性。
技術領域
本申請涉及計算機技術領域,尤其涉及一種模型訓練方法、數據獲取方法以及相關裝置。
背景技術
隨著移動終端相關技術的發展,越來越多的智能終端設備出現在人們的生活中,往往一個用戶對應著多個終端設備,而用戶在每個智能設備上都有對應的操作,為精確的確定該用戶的用戶畫像,如何確定多個設備是否屬于同一用戶成為難題。
一般,每個終端設備對應著一個標識碼,對于不同標識碼對應的終端設備通過程序登錄同一用戶賬號的行為,可以將該不同的標識碼對應的終端設備歸類為同一個用戶所使用,并進一步的對終端設備上的信息進行收集以及分析。
但是,可能存在用戶臨時登錄某一終端設備的情況,例如:借用他人的設備進行臨時登錄,此時用戶與該終端設備并不是對應的,造成了用戶識別的錯誤,影響用戶與標識碼關聯的準確性。
發明內容
有鑒于此,本申請提供一種模型訓練的方法,可以有效避免由于偶發狀況差異產生的標識碼關聯錯誤,提高識別碼匹配過程的精確性。
本申請第一方面提供一種模型訓練的方法,可以應用于終端設備中包含模型訓練功能的系統、手機找回程序或數據恢復程序中,具體包括:獲取多個訓練樣本,其中每個訓練樣本包括第一對象,以及與所述第一對象相關聯的至少兩個標識碼,所述至少兩個標識碼中的每個標識碼用于指示一個終端設備;
獲取所述每個訓練樣本中所述至少兩個標識碼分別指示的終端設備的行為信息,所述行為信息包括連接行為、下載行為或注冊行為中的至少一個;
根據所述行為信息確定用于第一模型訓練的特征向量;
將所述特征向量輸入所述第一模型,以得到第二模型,所述第二模型用于確定至少兩個目標標識碼之間的匹配結果,所述匹配結果用于指示所述至少兩個目標標識碼是否對應同一目標對象。
可選的,在本申請一些可能的實現方式中,所述根據所述行為信息確定用于第一模型訓練的特征向量,包括:
獲取所述行為信息中的用于指示標識碼對應的終端設備的網絡結構特征,所述網絡結構特征基于所述終端設備的應用程序列表確定;
確定所述網絡結構特征和所述標識碼的第一關聯關系;
根據所述第一關聯關系確定所述特征向量。
可選的,在本申請一些可能的實現方式中,所述根據所述第一關聯關系確定所述特征向量,包括:
根據所述第一關聯關系確定拓撲網絡;
基于所述拓撲網絡進行隨機游走,以生成節點序列,所述節點序列用于將所述標識碼基于所述網絡結構特征進行關聯;
將所述節點序列進行向量轉換,以確定所述特征向量。
可選的,在本申請一些可能的實現方式中,所述將所述節點序列進行向量轉換,以確定所述特征向量,包括:
確定所述節點序列中節點對應的屬性特征,所述屬性特征用于指示所述節點對應于所述標識碼或所述網絡結構特征;
將所述屬性特征和所述節點序列輸入卷積神經網絡模型,以輸出所述特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010003044.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種內存訓練的方法及系統
- 下一篇:信息顯示方法、裝置、電子設備和存儲介質
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





