[發明專利]數據篩選方法、多媒體數據的投放效果預測方法及裝置有效
| 申請號: | 202110587755.6 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113256335B | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 何遠舵 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 篩選 方法 多媒體 投放 效果 預測 裝置 | ||
本申請提供了一種數據篩選方法、多媒體數據的投放效果預測方法及裝置,涉及人工智能、區塊鏈、云技術及多媒體技術領域。該方法包括:獲取多個渠道對應的訓練數據集,對于多個渠道中各候選渠道的每個樣本,基于其樣本輸入,確定將該樣本作為目標投放渠道的樣本時對于訓練多媒體數據投放模型的貢獻度,并根據該貢獻度對其標簽進行修正;對于每個候選渠道,根據該渠道的各修正后的標簽及目標投放渠道的各標簽,確定該渠道與目標投放渠道間的數據偏移;根據各候選渠道對應的數據偏移,從各候選渠道中篩選目標渠道,將目標投放渠道的數據集和目標渠道的數據集作為模型的訓練數據集。基于該方案篩選出的訓練數據集,能夠有效提高投放模型的性能。
技術領域
本申請涉及人工智能、區塊鏈及多媒體技術領域,具體而言,本申請涉及一種數據篩選方法、多媒體數據的投放效果預測方法及裝置。
背景技術
在多媒體數據(如廣告)投放的應用場景中,為了預測潛在用戶的投放效果,會采用多媒體數據投放模型(如廣告投放模型)來預測某個或某些用戶關鍵指標。而為了提高數據的利用率和模型的泛化能力,在模型訓練時常會使用來自不同渠道的訓練數據,但模型部署時一般只會面向某個特定的渠道(可以稱為目標投放渠道),因此,訓練數據的分布與目標投放渠道的數據分布是存在差異的,模型訓練會面臨數據偏移的問題。
現有技術中,對于上述問題,一種處理方式是假定不同渠道的數據分布之間不存在數據偏移,訓練時不對不同渠道的樣本數據進行區分,雖然該方式雖然非常容易實現和落地,但是與真實情況往往不符,會導致模型的預測結果存在較大偏差。另一種方式則是假設不同渠道之間的數據分布之間的數據偏移都屬于某一種特定的偏移,并針對該特定偏移在訓練時進行一些數據調整,該方式雖然能夠實現對一定程度的調整,但是由于假設也是過于武斷,通常也是不符合實際情況的,訓練得到的模型的效果也仍需改進。
發明內容
本申請的目的旨在提供一種數據篩選方法、多媒體數據的投放效果預測方法及裝置,以篩選出更加適用于多媒體數據投放模型的訓練數據集,提高模型的能力。為了實現上述目的,本申請提供的技術方案如下:
一方面,本申請提供了一種數據篩選方法,該方法包括:
獲取多個渠道各自對應的訓練數據集,該多個渠道包括多媒體數據的目標投放渠道和至少一個候選渠道,訓練數據集中的每個樣本包括樣本輸入和標簽,樣本輸入為樣本對象的特征數據,標簽表征了樣本對象對應于多媒體數據的真實投放效果,候選渠道為非目標投放渠道;
對于各候選渠道的每個樣本,基于該樣本的樣本輸入,確定將該樣本作為目標投放渠道的樣本時,該樣本對于訓練多媒體數據投放模型的貢獻度,并根據該貢獻度對該樣本的標簽進行修正;
對于每個候選渠道,根據該渠道的各樣本修正后的標簽、以及目標投放渠道的各樣本的標簽,確定該渠道與目標投放渠道之間的數據偏移;
根據各候選渠道對應的數據偏移,從至少一個候選渠道中確定出至少一個目標渠道,將目標投放渠道的訓練數據集和各目標渠道的訓練數據集作為模型的訓練數據集。
另一方面,本申請還提供了一種多媒體數據投放效果預測方法,該方法包括:
獲取多媒體數據的候選投放對象的特征數據,該候選投放對象為屬于多媒體數據的目標投放渠道的對象;
將對象特征數據輸入至訓練好的多媒體數據投放模型中,得到候選投放對象對應于多媒體數據的預測投放效果;其中,該模型的訓練數據集是采用本申請提供的數據篩選方法得到的。
再一方面,本申請還提供了一種數據篩選裝置,該裝置包括:
數據集獲取模塊,用于獲取多個渠道各自對應的訓練數據集,該多個渠道包括多媒體數據的目標投放渠道和至少一個候選渠道,訓練數據集中的每個樣本包括樣本輸入和標簽,樣本輸入為樣本對象的特征數據,標簽表征了樣本對象對應于多媒體數據的真實投放效果,候選渠道為非目標投放渠道;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110587755.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:板材焊接用固定裝置
- 下一篇:一種鐵鹽污泥處理工藝及處理系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





