[發(fā)明專利]基于商業(yè)興趣的目標人群確定及信息推送方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201811491017.6 | 申請日: | 2018-12-06 |
| 公開(公告)號: | CN109597940A | 公開(公告)日: | 2019-04-09 |
| 發(fā)明(設計)人: | 謝常亮;吳安新;吳超;唐亞光;黃聲聲 | 申請(專利權)人: | 上海嗶哩嗶哩科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35 |
| 代理公司: | 上海大視知識產(chǎn)權代理事務所(特殊普通合伙) 31314 | 代理人: | 顧小偉;蔡沅 |
| 地址: | 200433 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標人群 商業(yè)興趣 分類標簽 信息推送 服務器 計算機程序 存儲器 信息接收終端 處理器執(zhí)行 互聯(lián)網(wǎng)技術 自定義特征 關鍵詞組 機器學習 推送信息 訓練數(shù)據(jù) 相關度 處理器 推送 標注 存儲 自動化 終端 分類 | ||
1.一種基于商業(yè)興趣的目標人群確定方法,其特征在于,所述的方法包括以下步驟:
(1)對已有的商業(yè)興趣分類標簽進一步分類標注,得到創(chuàng)意分類標簽;
(2)根據(jù)所述的創(chuàng)意分類標簽,獲取訓練數(shù)據(jù)并進行機器學習,得到基于所述的商業(yè)興趣分類標簽的相關度分值;
(3)根據(jù)所述的相關度分值,確定具有信息推送價值的目標人群。
2.根據(jù)權利要求1所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述步驟(1)具體為:根據(jù)已有的商業(yè)興趣分類標簽的結構類型,按照相應的創(chuàng)意分類內(nèi)容進行結構延伸和類目劃分,得到創(chuàng)意分類標簽。
3.根據(jù)權利要求2所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述商業(yè)興趣分類標簽為二級結構,所述創(chuàng)意分類標簽為三級結構,所述創(chuàng)意分類標簽的上二級結構與商業(yè)興趣分類標簽一致。
4.根據(jù)權利要求1所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述步驟(2)具體包括以下步驟:
(21)根據(jù)所述的創(chuàng)意分類標簽,獲取歷史用戶的操作日志;
(22)根據(jù)所述的操作日志,得到訓練數(shù)據(jù);
(23)根據(jù)所述的訓練數(shù)據(jù)進行機器學習,得到基于所述的創(chuàng)意分類標簽對應的商業(yè)興趣分類標簽的相關度分值。
5.根據(jù)權利要求4所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述步驟(22)具體包括以下步驟:
(221)根據(jù)所述的操作日志,通過樣本劃分得到用于機器學習的樣本數(shù)據(jù);
(222)根據(jù)所述的操作日志,提取分類特征,構造特征字典;
(223)將所述的樣本數(shù)據(jù)與所述的分類特征進行關聯(lián),得到所述的訓練數(shù)據(jù)。
6.根據(jù)權利要求5所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述步驟(221)具體為:遍歷所述的操作日志,將其中被點擊的廣告日志確定為正樣本,曝光未點擊的廣告日志確定為負樣本,得到用于機器學習的樣本數(shù)據(jù)。
7.根據(jù)權利要求6所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述步驟(221)還包括:將所述的操作日志中的異常數(shù)據(jù)進行清洗過濾。
8.根據(jù)權利要求5所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述步驟(222)具體為:根據(jù)所述的操作日志中的具體行為提取用戶對應的分類特征,并對所述的分類特征進行編號,得到所述的特征字典。
9.根據(jù)權利要求8所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述具體行為包括:搜索、播放、分享、收藏和投幣。
10.根據(jù)權利要求4所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述步驟(23)具體包括以下步驟:
(231)判斷所述的操作日志數(shù)量是否達到訓練閾值,若是則進入步驟(232),若否則返回步驟(21);
(232)根據(jù)機器學習的需求,劃分訓練數(shù)據(jù),得到訓練集、測試集和驗證集,并選擇訓練算法進行機器學習;
(233)將機器學習得到的分數(shù)結果通過歸一化劃分到0至1之間,得到基于所述的創(chuàng)意分類標簽對應的商業(yè)興趣分類標簽的相關度分值。
11.根據(jù)權利要求10所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述劃分訓練數(shù)據(jù)具體為:根據(jù)5折交叉驗證的方式對訓練數(shù)據(jù)進行劃分。
12.根據(jù)權利要求10所述基于商業(yè)興趣的目標人群確定方法,其特征在于,所述訓練算法具體為XGBoost算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海嗶哩嗶哩科技有限公司,未經(jīng)上海嗶哩嗶哩科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811491017.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 基于用戶興趣的本地商業(yè)服務推薦系統(tǒng)及方法
- 一種基于互聯(lián)網(wǎng)的個人與商業(yè)資源匹配的方法
- 商圈識別方法及設備
- 預測對于估計到達時間的興趣點等待時間
- 一種基于商業(yè)WIFI行業(yè)屬性的主動營銷方法和系統(tǒng)
- 一種基于主題模型和遺忘規(guī)律的興趣預測挖掘方法及系統(tǒng)
- 信息推薦方法和裝置
- 基于商業(yè)興趣的目標人群確定及信息推送方法和系統(tǒng)
- 基于地理網(wǎng)格化技術的興趣點庫更新方法及裝置、設備
- 令人工神經(jīng)網(wǎng)絡具備店鋪選址能力的訓練方法、店鋪選址方法、系統(tǒng)及存儲介質(zhì)





