[發明專利]一種用戶投遞意愿模型的構建方法和計算設備在審
| 申請號: | 201710827720.9 | 申請日: | 2017-09-14 |
| 公開(公告)號: | CN107633326A | 公開(公告)日: | 2018-01-26 |
| 發明(設計)人: | 方軻 | 申請(專利權)人: | 北京拉勾科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/10;G06K9/62;H04L29/08 |
| 代理公司: | 北京思睿峰知識產權代理有限公司11396 | 代理人: | 謝建云,趙愛軍 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 投遞 意愿 模型 構建 方法 計算 設備 | ||
1.一種用戶投遞意愿模型的構建方法,適于在計算設備中執行,所述計算設備與數據存儲裝置連接,所述數據存儲裝置中存儲有多個用戶在目標網站的操作數據,所述操作數據包括動作數據和投遞數據,該方法包括:
獲取多個用戶在當前日期之前預定天數內的操作數據,并根據獲取到的操作數據構造樣本集,所述樣本集中的每條樣本包括用戶標識、用戶每天的操作數據和用戶在當前日期的前一天是否有投遞操作;
根據用戶在當前日期的前一天是否有投遞操作將各條樣本標記為正樣本或負樣本,對負樣本按照第一比例進行抽樣,并將正樣本與抽樣后的負樣本按照第二比例生成訓練集;
根據訓練集中的操作數據計算各條樣本的多個特征值,并將正負樣本標識和多個特征值構造為樣本的特征向量;以及
采用預定算法對訓練集中各樣本的特征向量進行訓練,得到用戶投遞意愿模型,所述用戶投遞意愿模型的輸入為目標用戶的多個特征值,輸出為該用戶的投遞意愿概率值。
2.如權利要求1所述的方法,其中,所述動作數據包括動作類型和動作時間,所述動作類型包括點擊、收藏、瀏覽,所述操作數據還包括登錄數據,所述登錄數據包括登錄時間,所述投遞數據包括投遞時間。
3.如權利要求1所述的方法,其中,所述多個特征值包括以下特征值中的至少兩個:
當前日期是星期幾;當前日期距離注冊日的天數;投遞總次數;平均每天投遞次數;當前日期距離上次投遞的天數;當前日期距離上次動作的天數;最大連續動作天數;有過動作的天數;有過投遞的天數;平均投遞天數;平均動作天數。
4.如權利要求1所述的方法,還包括步驟:
將所述多個特征值中的每個特征值分別除以訓練集中對應特征值的最大值,以將各特征值進行歸一化。
5.如權利要求1所述的方法,所述預定算法為GBDT回歸算法。
6.如權利要求5所述的方法,其中,所述采用預定算法對訓練集中各樣本的特征向量進行訓練的步驟包括:
采用不同的GBDT算法參數,分別對訓練集中各樣本的特征向量進行訓練,得到每種算法參數對應的用戶投遞意愿模型;
設定不同的判定閾值,對于每種算法參數對應的用戶投遞意愿模型,計算訓練集中各條樣本在該模型下的投遞意愿概率值,并計算每種判定閾值下對是否產生投遞的預測結果與真實結果的誤差值;以及
選取誤差值最小時的算法參數和判定閾值分別作為生效算法參數和生效判定閾值,并將生效算法參數對應的用戶投遞意愿模型作為生效用戶投遞意愿模型。
7.如權利要求6所述的方法,其中,所述誤差值采用AUC來表征。
8.如權利要求6所述的方法,還包括步驟:
從數據存儲裝置中獲取全部用戶在當前日期之前預定天數內的操作數據,并根據該操作數據計算各用戶的多個特征值;以及
分別將各用戶的多個特征值輸入到所述生效用戶投遞意愿模型中,計算得到各用戶的投遞意愿概率值,并根據所述生效判定閾值預測各用戶是否會在當前日期進行投遞操作。
9.一種計算設備,包括:
至少一個處理器;和
存儲有程序指令的存儲器,其中,所述程序指令被配置為適于由所述至少一個處理器執行,所述程序指令包括用于執行如權利要求1-8中任一項所述的方法的指令。
10.一種存儲有程序指令的可讀存儲介質,當所述程序指令被計算設備讀取并執行時,使得所述計算設備執行如權利要求1-8中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京拉勾科技有限公司,未經北京拉勾科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710827720.9/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





