[發明專利]對象推送方法、裝置、計算機設備及存儲介質在審
| 申請號: | 201910698531.5 | 申請日: | 2019-07-31 |
| 公開(公告)號: | CN110413893A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 袁一方 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/735;G06F16/635 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 黃晶晶 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 推送 候選對象 目標用戶標識 計算機設備 存儲介質 基本信息 歷史對象 樣本對象 樣本 環境狀態信息 目標對象標識 表征樣本 動作信息 目標對象 評分模型 強化學習 樣本數據 樣本用戶 興趣度 獎勵 迭代 申請 多樣性 終端 輸出 | ||
本申請涉及一種對象推送方法、裝置、計算機設備及存儲介質,該方法包括:獲取與目標用戶標識對應的候選對象標識和歷史對象標識;獲取各候選對象標識對應的基本信息;將所述候選對象標識和歷史對象標識作為環境狀態信息、以及將所述基本信息作為動作信息,輸入評分模型,輸出各候選對象標識對應的推送分值;根據所述推送分值,從所述候選對象標識中,選取向所述目標用戶標識所對應的終端推送的目標對象標識;其中,所述評分模型,是通過對包括樣本獎勵值的樣本數據進行迭代地強化學習訓練得到;所述樣本獎勵值,用于表征樣本用戶對樣本對象的興趣度、以及表征向樣本用戶推送樣本對象時的推送類別多樣性。本申請的方案,能夠提高推送的目標對象的準確性。
技術領域
本發明涉及計算機技術領域,特別是涉及一種對象推送方法、裝置、計算機設備及存儲介質。
背景技術
隨著科學技術的飛速發展,大量先進技術不斷涌現。對象推送是目前比較重要的一項技術,在日常生活和工作中的應用越來越廣泛。比如,新聞推送在如今的信息時代,起著非常重要的作用。
傳統方法中,是用待推送的對象的特征,與用戶的特征進行一一匹配,根據匹配結果選擇最終要推送的對象。顯然,傳統方法這種根據用戶特征進行匹配的推送策略,會導致用戶收到的對象形式過于局限,導致推送不夠準確。
發明對象
基于此,有必要針對傳統方法推送不夠準確的問題,提供一種對象推送方法、裝置、計算機設備及存儲介質。
一種對象推送方法,所述方法包括:
獲取與目標用戶標識對應的候選對象標識和歷史對象標識;
獲取各候選對象標識對應的基本信息;
將所述候選對象標識和歷史對象標識作為環境狀態信息、以及將所述基本信息作為動作信息,輸入評分模型,輸出各候選對象標識對應的推送分值;
根據所述推送分值,從所述候選對象標識中,選取向所述目標用戶標識所對應的終端推送的目標對象標識;
其中,所述評分模型,是通過對包括樣本獎勵值的樣本數據進行迭代地強化學習訓練得到;所述樣本獎勵值,用于表征樣本用戶對樣本對象的興趣度、以及表征向樣本用戶推送樣本對象時的推送類別多樣性。
在其中一個實施例中,所述根據所述推送分值,從所述候選對象標識中,選取向所述目標用戶標識所對應的終端推送的目標對象標識包括:
選取推送分值最高的候選對象標識,作為目標對象標識;
所述方法還包括:
根據與所述目標對象標識對應的基本信息,生成推送信息;
按照所述目標用戶標識,下發所述推送信息。
在其中一個實施例中,所述方法還包括:
獲取目標用戶標識對應的用戶信息;
所述將所述候選對象標識和歷史對象標識作為環境狀態信息、以及將所述基本信息作為動作信息,輸入評分模型,輸出各候選對象標識對應的推送分值包括:
將所述候選對象標識、歷史對象標識和所述用戶信息作為環境狀態信息、以及將所述基本信息作為動作信息,輸入評分模型,輸出各候選對象標識對應的推送分值。
在其中一個實施例中,所述評分模型的訓練步驟包括:
獲取樣本數據;同一組樣本數據中包括對應于同一樣本用戶的樣本對象標識的集合、各樣本對象標識的基本信息和樣本獎勵值;所述樣本對象標識包括樣本歷史對象標識和樣本候選對象標識;
在每輪強化學習迭代訓練中,將集合作為當前環境狀態信息及將各樣本對象標識的基本信息作為動作信息,輸入主網絡,預測各樣本對象標識的推送分值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910698531.5/2.html,轉載請聲明來源鉆瓜專利網。





