[發明專利]數據篩選方法、多媒體數據的投放效果預測方法及裝置有效
| 申請號: | 202110587755.6 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113256335B | 公開(公告)日: | 2021-10-12 |
| 發明(設計)人: | 何遠舵 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 篩選 方法 多媒體 投放 效果 預測 裝置 | ||
1.一種數據篩選方法,其特征在于,包括:
獲取多個渠道各自對應的訓練數據集,所述多個渠道包括多媒體數據的目標投放渠道和至少一個候選渠道,所述訓練數據集中的每個樣本包括樣本輸入和標簽,所述樣本輸入為樣本對象的特征數據,所述標簽表征了樣本對象對應于多媒體數據的真實投放效果,所述候選渠道為非目標投放渠道;
對于各所述候選渠道的每個樣本,基于該樣本的樣本輸入,確定將該樣本作為所述目標投放渠道的樣本時,該樣本對于訓練多媒體數據投放模型的貢獻度,并根據該貢獻度對該樣本的標簽進行修正;
對于每個所述候選渠道,根據該渠道的各樣本修正后的標簽、以及所述目標投放渠道的各樣本的標簽,確定該渠道與目標投放渠道之間的數據偏移;
根據各所述候選渠道對應的數據偏移,從所述至少一個候選渠道中確定出至少一個目標渠道,將所述目標投放渠道的訓練數據集和各所述目標渠道的訓練數據集作為所述模型的訓練數據集;
其中,對于各所述候選渠道的每個樣本,所述基于該樣本的樣本輸入,確定將該樣本作為所述目標投放渠道的樣本時,該樣本對于訓練多媒體數據投放模型的貢獻度,包括:
基于該樣本的樣本輸入,預測該樣本對應的第一概率和第二概率,其中,所述第一概率為該樣本所屬的渠道為所述目標投放渠道的概率,所述第二概率為該樣本所屬的渠道是其真實所屬的候選渠道的概率;
基于該樣本對應的第一概率和第二概率的比值,確定為該樣本對應的貢獻度。
2.根據權利要求1所述的方法,其特征在于,所述基于該樣本的樣本輸入,預測該樣本對應的第一概率和第二概率,包括:
基于該樣本的樣本輸入,通過多分類模型預測該樣本所屬的渠道是所述多個渠道中各個渠道的概率,所述第一概率為預測得到多個概率中對應于所述目標投放渠道的概率,所述第二概率為所述多個概率中對應于該樣本真實所屬渠道的概率。
3.根據權利要求1所述的方法,其特征在于,對于各所述候選渠道的每個樣本,所述根據該貢獻度對該樣本的標簽進行修正,包括:
將該樣本對應的貢獻度作為權重,對該樣本對應的標簽進行加權,得到修正后的標簽。
4.根據權利要求1所述的方法,其特征在于,對于每個所述候選渠道,所述根據該渠道的各樣本修正后的標簽、以及所述目標投放渠道的各樣本的標簽,確定該渠道與目標投放渠道之間的數據偏移,包括:
根據該渠道的各樣本修正后的標簽,確定該渠道對應的整體投放效果;
根據所述目標投放渠道的各樣本的標簽,確定所述目標投放渠道對應的整體投放效果;
根據該渠道對應的整體投放效果和所述目標投放渠道對應的整體投放效果之間的差異,確定該渠道與目標投放渠道之間的數據偏移。
5.根據權利要求1至4中任一項所述的方法,其特征在于,所述根據各所述候選渠道對應的數據偏移,從所述至少一個候選渠道中確定出至少一個目標渠道,包括:
按照各所述候選渠道對應的數據偏移由小到大的順序,依次對各所述候選渠道執行以下操作,直至當前候選渠道對應的模型性能評價指標不滿足預設條件,并將數據偏移小于當前候選渠道對應的數據偏移的各候選渠道作為各目標渠道:
基于當前候選渠道的訓練數據集對第一模型進行訓練,直至滿足訓練結束條件,并確定當前訓練后的模型的性能評價指標,若當前訓練后的模型的性能評價指標滿足預設條件,則將下一個候選渠道作為新的當前候選渠道;
其中,所述第一模型為以下任一項:
初始的多媒體數據投放模型;
對初始的多媒體數據投放模型進行預訓練得到的預訓練后的模型;
上一次所述操作對應的訓練后的模型。
6.根據權利要求5所述的方法,其特征在于,所述基于當前候選渠道的訓練數據集對第一模型進行訓練,包括:
基于所述當前候選渠道的訓練數據集和第一數據集,對所述第一模型進行訓練,其中,所述第一數據集包括以下至少一項:
所述目標投放渠道對應的訓練數據集;
各第一渠道中的至少一個渠道對應的訓練數據集,所述第一渠道是指數據偏移小于所述當前候選渠道對應的數據偏移的候選渠道。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110587755.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:板材焊接用固定裝置
- 下一篇:一種鐵鹽污泥處理工藝及處理系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





