[發(fā)明專利]一種目標(biāo)用戶的選擇方法和裝置有效
| 申請?zhí)枺?/td> | 201911194019.3 | 申請日: | 2019-11-28 |
| 公開(公告)號: | CN111027676B | 公開(公告)日: | 2022-03-18 |
| 發(fā)明(設(shè)計(jì))人: | 李晨晨;閻翔;喬俊龍;屈超;熊君武;宋樂 | 申請(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06Q30/02 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 靳玫 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 目標(biāo) 用戶 選擇 方法 裝置 | ||
本說明書實(shí)施例提供一種目標(biāo)用戶的選擇方法和裝置,其中,所述方法包括:對于待選用戶群體中的每一個(gè)用戶,分別執(zhí)行如下處理:將所述用戶的用戶特征輸入預(yù)先訓(xùn)練的策略決定網(wǎng)絡(luò),得到所述策略決定網(wǎng)絡(luò)預(yù)測輸出的所述目標(biāo)業(yè)務(wù)操作對應(yīng)的操作獎(jiǎng)勵(lì)值,所述操作獎(jiǎng)勵(lì)值用于表示對所述用戶執(zhí)行目標(biāo)業(yè)務(wù)操作后的凈提升響應(yīng)預(yù)測值;根據(jù)所述待選用戶群體中各個(gè)用戶的所述操作獎(jiǎng)勵(lì)值,選擇所述操作獎(jiǎng)勵(lì)值符合篩選條件的用戶作為所述目標(biāo)用戶。
技術(shù)領(lǐng)域
本說明書涉及機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,特別涉及一種目標(biāo)用戶的選擇方法和裝置。
背景技術(shù)
在市場營銷中常常碰到這樣的情況:營銷部門做了很多研究,認(rèn)為已經(jīng)把握了用戶的特點(diǎn),于是按照這些用戶特點(diǎn)挑選用戶作為營銷目標(biāo)。但活動(dòng)推出后結(jié)果令人失望:試驗(yàn)組(參加了營銷的用戶)和控制組(沒有參加營銷的用戶)的凈提升響應(yīng)沒有明顯的差別。之所以出現(xiàn)這種情況,原因在于沒有區(qū)分可受營銷影響的用戶和不受營銷影響的用戶,應(yīng)該去尋找可受營銷影響的用戶進(jìn)行營銷才能最大化凈提升響應(yīng)。該可受營銷影響的用戶即用戶在有營銷情況下的響應(yīng)與無營銷情況下的響應(yīng)存在明顯差別。
發(fā)明內(nèi)容
有鑒于此,本說明書一個(gè)或多個(gè)實(shí)施例提供一種目標(biāo)用戶的選擇方法和裝置。
具體地,本說明書一個(gè)或多個(gè)實(shí)施例是通過如下技術(shù)方案實(shí)現(xiàn)的:
第一方面,提供一種目標(biāo)用戶的選擇方法,所述方法用于由待選用戶群體中選擇部分用戶作為目標(biāo)用戶,以對所述目標(biāo)用戶執(zhí)行目標(biāo)業(yè)務(wù)操作,所述方法包括:
對于所述待選用戶群體中的每一個(gè)用戶,分別執(zhí)行如下處理:將所述用戶的用戶特征輸入預(yù)先訓(xùn)練的策略決定網(wǎng)絡(luò),得到所述策略決定網(wǎng)絡(luò)預(yù)測輸出的所述目標(biāo)業(yè)務(wù)操作對應(yīng)的操作獎(jiǎng)勵(lì)值,所述操作獎(jiǎng)勵(lì)值用于表示對所述用戶執(zhí)行目標(biāo)業(yè)務(wù)操作后的凈提升響應(yīng)預(yù)測值;
根據(jù)所述待選用戶群體中各個(gè)用戶的所述操作獎(jiǎng)勵(lì)值,選擇所述操作獎(jiǎng)勵(lì)值符合篩選條件的用戶作為所述目標(biāo)用戶。
第二方面,提供一種目標(biāo)用戶的選擇裝置,所述用于由待選用戶群體中選擇部分用戶作為目標(biāo)用戶,以對目標(biāo)用戶執(zhí)行目標(biāo)業(yè)務(wù)操作,所述裝置包括:
預(yù)測輸出模塊,用于對于所述待選用戶群體中的每一個(gè)用戶,分別執(zhí)行如下處理:將所述用戶的用戶特征輸入預(yù)先訓(xùn)練的策略決定網(wǎng)絡(luò),得到所述策略決定網(wǎng)絡(luò)預(yù)測輸出的所述目標(biāo)業(yè)務(wù)操作對應(yīng)的操作獎(jiǎng)勵(lì)值,所述操作獎(jiǎng)勵(lì)值用于表示對所述用戶執(zhí)行目標(biāo)業(yè)務(wù)操作后的凈提升響應(yīng)預(yù)測值;
用戶選擇模塊,用于根據(jù)所述待選用戶群體中各個(gè)用戶的所述操作獎(jiǎng)勵(lì)值,選擇所述操作獎(jiǎng)勵(lì)值符合篩選條件的用戶作為所述目標(biāo)用戶。
第三方面,提供一種電子設(shè)備,所述電子設(shè)備包括存儲器、處理器,所述存儲器用于存儲可在處理器上運(yùn)行的計(jì)算機(jī)指令;所述處理器用于在執(zhí)行所述計(jì)算機(jī)指令時(shí)實(shí)現(xiàn)本說明書任一實(shí)施例所述的目標(biāo)用戶的選擇方法。
本說明書一個(gè)或多個(gè)實(shí)施例的目標(biāo)用戶的選擇方法和裝置,通過使用策略決定網(wǎng)絡(luò)來預(yù)測對用戶執(zhí)行業(yè)務(wù)操作時(shí)獲得的凈提升響應(yīng),使得可以根據(jù)網(wǎng)絡(luò)輸出的該操作獎(jiǎng)勵(lì)值由用戶群體中選擇最終的目標(biāo)用戶,從而獲得較好的響應(yīng)效果;并且,該方法還具有較好的泛化能力和擴(kuò)展性,對于訓(xùn)練樣本集之外的其他用戶群體中選擇目標(biāo)用戶時(shí)都同樣適用于該策略決定網(wǎng)絡(luò)。
附圖說明
為了更清楚地說明本說明書一個(gè)或多個(gè)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本說明書一個(gè)或多個(gè)實(shí)施例中記載的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本說明書至少一個(gè)實(shí)施例提供的一種強(qiáng)化學(xué)習(xí)的網(wǎng)絡(luò)訓(xùn)練原理圖;
圖2為本說明書至少一個(gè)實(shí)施例提供的一種累積增益差異的原理示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911194019.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:交通擁堵的治理方法及裝置
- 下一篇:一種播放資源管理系統(tǒng)
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





