[發明專利]數據確定方法、裝置、電子設備及存儲介質在審
| 申請號: | 202111565403.7 | 申請日: | 2021-12-20 |
| 公開(公告)號: | CN114330519A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 林偉;陳超超 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 確定 方法 裝置 電子設備 存儲 介質 | ||
本公開關于一種數據確定方法、裝置、電子設備及存儲介質,能夠從多個方面刻畫用戶興趣,提高召回率;涉及大數據處理技術領域。該方法包括:獲取目標對象針對目標資源的交互信息;根據所述交互信息確定所述目標對象的特征;所述目標對象的特征包括多個維度的特征;確定多組權重系數,每組權重系數包括與所述多個維度的特征對應的多個權重系數;對每組權重系數與所述目標對象的特征進行加權處理,得到所述目標對象的多個向量;其中,目標對象的每個向量對應一組權重系數;對所述目標對象的每個向量檢索相關性符合預設要求的候選資源,根據所述目標對象的多個向量中每個向量對應的候選資源確定所述目標對象對應的數據召回結果。
技術領域
本公開涉及大數據處理技術領域,尤其涉及一種數據確定方法、數據確定裝置、電子設備、計算機可讀存儲介質及計算機程序產品。
背景技術
數據召回指的是從具有上百萬條數據的數據庫中確定出用戶最感興趣的一部分數據的過程。數據具體可以包括圖片、文本、視頻等,也可以包括目標資源,例如廣告、商品等。確定出的數據會經過排序后展現給用戶,對數據檢索、信息推廣等均具有至關重要的作用。
相關技術中,數據召回主要采用:基于向量化的召回方案,基于標簽的召回方案,以及基于特征的召回方案。其中,基于向量化的召回方案通過神經網絡為用戶和廣告各學習一個向量表達,再計算用戶的向量與廣告的向量的相關性,對相關性高的目標廣告進行召回。然而,用戶的興趣往往是多樣的,上述基于向量化的召回方案難以刻畫用戶多方面的興趣,其召回結果偏向熱門廣告,缺乏準確性。
發明內容
本公開提供一種數據確定方法、裝置、電子設備及存儲介質,以至少解決相關技術中數據召回的準確性低的問題。本公開的技術方案如下:
根據本公開實施例的第一方面,提供一種數據確定方法,包括:獲取目標對象針對目標資源的交互信息;根據交互信息確定目標對象的特征;目標對象的特征包括多個維度的特征;確定多組權重系數,每組權重系數包括與多個維度的特征對應的多個權重系數;對每組權重系數與目標對象的特征進行加權處理,得到目標對象的多個向量;其中,目標對象的每個向量對應一組權重系數;對目標對象的每個向量檢索相關性符合預設要求的候選資源,根據目標對象的多個向量中每個向量對應的候選資源確定目標對象對應的數據召回結果。
本公開的實施例提供的技術方案至少帶來以下有益效果:
在本實施例的技術方案中,根據目標對象的特征可以得到目標對象的多個向量,多個向量可以從多個方面刻畫用戶興趣,從而使得召回的數據能夠更加全面地匹配用戶興趣,提高召回率。同時,將一個目標對象通過多個向量來表達,能增大不同用戶之間的差異,使得召回的數據更加滿足用戶的個性化需求,從而提高數據召回的準確性。
在一種示例性實施方式中,對每組權重系數與所述目標對象的特征進行加權處理,得到目標對象的多個向量包括:將所述目標對象的特征輸入預置的多個特征選擇網絡,每個特征選擇網絡中包含一組權重系數,通過所述特征選擇網絡的權重系數為所述目標對象的特征進行加權,獲得每個所述特征選擇網絡輸出的向量。
上述特征選擇網絡為一機器學習模型,通過機器學習模型的方式為目標對象的特征進行加權,可以提高權重系數的準確性,并且該權重系數可以不斷進行更新,保證可用性和有效性。
在一種示例性實施方式中,上述方法還包括:獲取樣本特征以及所述樣本特征對應的標簽信息;其中,所述樣本特征中包含樣本對象特征以及樣本資源特征;所述標簽信息用于表征所述樣本對象特征對應的樣本對象與所述樣本資源特征對應的樣本資源之間是否存在交互行為;將所述樣本特征中的樣本對象特征輸入多個第一模型,獲得每個所述第一模型輸出的樣本向量;確定所述樣本特征中樣本資源特征對應的樣本資源向量;分別計算每個樣本向量與所述樣本資源向量的相似度,確定所述相似度最高的目標樣本向量;根據所述目標樣本向量和所述樣本資源向量,確定預估交互行為發生概率;根據所述預估交互行為發生概率和所述樣本特征對應的標簽信息,訓練所述多個第一模型,直至滿足預設訓練結束條件,得到所述多個特征選擇網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111565403.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種車輛部件的氣密性檢測方法及設備
- 下一篇:一種蓄電池房間環境保障系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





