[發明專利]確定標簽的方法、裝置、電子設備及可讀存儲介質在審
| 申請號: | 201910168755.5 | 申請日: | 2019-03-06 |
| 公開(公告)號: | CN110046928A | 公開(公告)日: | 2019-07-23 |
| 發明(設計)人: | 王月穎;陳沙沙 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q10/06 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預估 行為產生 標簽 可讀存儲介質 概率 電子設備 概率樣本 校準 歷史行為數據 實際行為 輸入校準 校準模型 映射關系 準確度 預設 申請 | ||
本申請實施例提供了一種確定標簽的方法、裝置、電子設備及可讀存儲介質,以提高確定標簽的準確度。所述方法包括:根據用戶的歷史行為數據,確定所述用戶的預估行為產生概率;將所述用戶的預估行為產生概率輸入校準模型,以對所述用戶的預估行為產生概率進行校準,其中,所述校準模型是以多組預估行為產生概率樣本值和實際行為產生概率樣本值之間的映射關系為輸入,對第一預設模型進行訓練所得到的模型;根據所述用戶的校準后的預估行為產生概率,確定所述用戶的標簽。
技術領域
本申請實施例涉及數據處理技術領域,尤其涉及一種確定標簽的方法、裝置、電子設備及可讀存儲介質。
背景技術
準確地確定用戶的標簽對信息推送具有重大意義,根據用戶的標簽,可以精準地向用戶推送合適的信息。
相關技術提供了一種基于用戶畫像確定用戶標簽的方法。采用該方法,首先,確定用戶的用戶畫像,確定一個用戶的用戶畫像而使用的信息包括該用戶的基本信息,例如:性別、年齡、星座、常駐地等,也包括該用戶的行為頻次,例如:信息點擊頻次,信息瀏覽頻次等等。然后,根據一個用戶的用戶畫像確定該用戶的標簽。
然而,上述確定用戶的標簽的方法僅僅依賴于用戶畫像,而確定用戶的用戶畫像的信息不一定真實,導致用戶畫像的準確度不夠高,進而直接影響到用戶標簽的準確度。因而,相關技術中的確定用戶標簽的方法的準確度有待提高。
發明內容
本申請實施例提供一種確定標簽的方法、裝置、電子設備及可讀存儲介質,以提高確定用戶的標簽的準確度。
本申請實施例第一方面提供了一種確定用戶的標簽的方法,所述方法包括:
根據用戶的歷史行為數據,確定所述用戶的預估行為產生概率;
將所述用戶的預估行為產生概率輸入校準模型,以對所述用戶的預估行為產生概率進行校準,其中,所述校準模型是以多組預估行為產生概率樣本值和實際行為產生概率樣本值之間的映射關系為輸入,對第一預設模型進行訓練所得到的模型;
根據所述校準后的預估行為產生概率,確定所述用戶的標簽。可選地,所述方法還包括:
獲得信息發布方設置的目標參數;
采集所述用戶的與所述目標參數關聯的歷史行為數據。
可選地,在確定所述用戶的標簽之后,所述方法還包括:
根據所述目標參數,確定目標受眾;
向所述目標受眾推送所述信息發布方發布的信息。
可選地,所述校準模型是按以下步驟得到的:
按照所述多個樣本數據各自的預估行為產生概率的大小,對所述多個樣本數據進行排序;
將排序后的多個樣本數據分劃分為多組樣本數據;
針對所述多組樣本數據中的每組樣本數據,對該組樣本數據的預估行為產生概率進行平均,得到該組預估行為產生概率樣本值;
根據該組樣本數據中每個樣本數據攜帶的標記是否是預設標記,確定該組樣本數據中攜帶的標記是預設標記的樣本數據的占比,并將所述占比確定為該組實際行為產生概率樣本值;
根據多組預估行為產生概率樣本值和實際行為產生概率樣本值之間的映射關系為輸入,對第一預設模型進行訓練,得到所述校準模型。
可選地,根據用戶的歷史行為數據,確定所述用戶的預估行為產生概率,包括:
獲得所述用戶的站內歷史行為數據和站外歷史行為數據;
將所述用戶的站內歷史行為數據和站外歷史行為數據輸入行為產生概率預估模型,確定所述用戶的預估行為產生概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910168755.5/2.html,轉載請聲明來源鉆瓜專利網。





