[發(fā)明專利]數(shù)據(jù)處理方法及裝置在審
| 申請?zhí)枺?/td> | 202310438429.8 | 申請日: | 2023-04-21 |
| 公開(公告)號: | CN116501961A | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設計)人: | 林少川 | 申請(專利權(quán))人: | 拉扎斯網(wǎng)絡科技(上海)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F18/25;G06F18/214;G06F18/22 |
| 代理公司: | 北京睿派知識產(chǎn)權(quán)代理有限公司 11597 | 代理人: | 劉鋒 |
| 地址: | 200333 上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)處理 方法 裝置 | ||
本發(fā)明實施例公開了一種數(shù)據(jù)處理方法及裝置。通過將獲取的第一上下文特征向量分別與各待輸入特征向量輸入對應的多個時空特征匹配模型進行過濾處理,以確定多個時空特征匹配向量,進而根據(jù)多個時空特征匹配向量和用戶歷史偏好特征向量確定組合特征向量,然后將組合特征向量與第一上下文特征向量輸入時空特征融合模型進行融合處理,以確定時空特征融合向量,最后將時空特征融合向量與第一上下文特征向量輸入點擊率預測模型以確定點擊率預測值。由此,可以通過時空特征匹配模型與時空特征融合模型根據(jù)時空特征對獲取的各特征向量進行動態(tài)適配,以提高動態(tài)適配效果,從而在實現(xiàn)提高點擊率預測準確性的同時,具有較高的普適性。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法及裝置。
背景技術(shù)
隨著網(wǎng)絡和計算機技術(shù)的不斷發(fā)展,越來越多的用戶通過互聯(lián)網(wǎng)獲取數(shù)據(jù)信息,例如,通過互聯(lián)網(wǎng)或應用程序獲取圖文信息,公眾號信息,視頻,新聞、商戶信息、商品信息等。
在現(xiàn)有技術(shù)中,通常基于向用戶展示的歷史數(shù)據(jù)信息和被點擊的數(shù)據(jù)信息,訓練得到用于預測用戶對于某個目標對象的點擊率的機器學習模型;并在后續(xù)向特定的用戶推薦數(shù)據(jù)信息時,通過該機器學習模型可以預測各個目標對象被用戶點擊的幾率,并基于預測出的幾率確定向該用戶推送的目標對象。
一方面,由于在用戶的生活環(huán)境中,人(也即用戶)、目標對象(例如公眾號、商品等)、場(也即時空特征,例如時間、位置等)相互關(guān)聯(lián),現(xiàn)有技術(shù)忽略了時空特征對用戶、目標對象的影響,導致模型輸出的預測點擊率不準確;另一方面,當時空特征存在變化時,使得時空特征對人和目標對象的關(guān)聯(lián)較為復雜,現(xiàn)有技術(shù)的機器學習模型無法進行動態(tài)適配,導致適配效率較低,且適配效果較差。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例的目的在于提供一種數(shù)據(jù)處理方法及裝置,可以通過時空特征匹配模型與時空特征融合模型根據(jù)時空特征對獲取的各特征向量進行動態(tài)適配,以提高動態(tài)適配效果,從而在實現(xiàn)提高點擊率預測準確性的同時,具有較高的普適性。
第一方面,本發(fā)明實施例提供了一種數(shù)據(jù)處理方法,所述方法包括:
獲取多個待處理特征信息,所述多個待處理特征信息包括用戶特征信息、用戶歷史行為特征信息、目標對象特征信息和所述目標對象的與時空特征相關(guān)的上下文特征信息;
根據(jù)所述多個待處理特征信息確定多個待輸入特征向量、用戶歷史偏好特征向量和目標對象的與時空特征相關(guān)的第一上下文特征向量,所述多個待輸入特征向量包括用戶特征向量、目標對象特征向量和用戶興趣特征向量;
將所述第一上下文特征向量分別與各所述待輸入特征向量輸入對應的多個時空特征匹配模型進行過濾處理,以確定多個時空特征匹配向量;
根據(jù)所述多個時空特征匹配向量和所述用戶歷史偏好特征向量確定組合特征向量;
將所述組合特征向量與所述第一上下文特征向量輸入時空特征融合模型進行融合處理,以確定時空特征融合向量;以及
將所述時空特征融合向量與所述第一上下文特征向量輸入點擊率預測模型以確定點擊率預測值。
第二方面,本發(fā)明實施例提供了一種數(shù)據(jù)處理模型訓練方法,所述方法包括:
確定多個訓練樣本,所述多個訓練樣本包括正訓練樣本和負訓練樣本,所述正訓練樣本的標簽為正,所述負訓練樣本的標簽為負;
將各所述訓練樣本輸入到初始化的數(shù)據(jù)處理模型中,基于所述標簽和預設的損失函數(shù),訓練所述數(shù)據(jù)處理模型;
其中,所述數(shù)據(jù)處理模型執(zhí)行如下數(shù)據(jù)處理過程:
獲取訓練樣本的多個待處理特征信息,所述多個待處理特征信息包括用戶特征信息、用戶歷史行為特征信息、目標對象特征信息和所述目標對象的與時空特征相關(guān)的上下文特征信息;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于拉扎斯網(wǎng)絡科技(上海)有限公司,未經(jīng)拉扎斯網(wǎng)絡科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310438429.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:瓣膜沖擊波球囊導管
- 下一篇:軌道車輛地板、車廂及軌道車輛
- 數(shù)據(jù)處理設備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





