[發(fā)明專利]一種用戶投遞意愿模型的構(gòu)建方法和計(jì)算設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201710827720.9 | 申請(qǐng)日: | 2017-09-14 |
| 公開(kāi)(公告)號(hào): | CN107633326A | 公開(kāi)(公告)日: | 2018-01-26 |
| 發(fā)明(設(shè)計(jì))人: | 方軻 | 申請(qǐng)(專利權(quán))人: | 北京拉勾科技有限公司 |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06Q10/10;G06K9/62;H04L29/08 |
| 代理公司: | 北京思睿峰知識(shí)產(chǎn)權(quán)代理有限公司11396 | 代理人: | 謝建云,趙愛(ài)軍 |
| 地址: | 100080 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用戶 投遞 意愿 模型 構(gòu)建 方法 計(jì)算 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種用戶投遞意愿模型的構(gòu)建方法和計(jì)算設(shè)備。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)應(yīng)聘/招聘已經(jīng)成了求職者應(yīng)聘工作、用人單位招聘員工的主要途徑。用人單位和求職者在第三方的人才招聘網(wǎng)站上注冊(cè)賬號(hào),相互之間進(jìn)行搜索和交流,以尋求最滿意的對(duì)象。一般用戶找工作都具有很強(qiáng)的時(shí)效性,用戶通常只在某個(gè)時(shí)間窗口具有找工作的意愿,過(guò)了該時(shí)間窗口,用戶就不尋求就業(yè)機(jī)會(huì)了。如果能夠準(zhǔn)確預(yù)測(cè)用戶最近是否活躍,并根據(jù)用戶活躍程度對(duì)人才搜索結(jié)果調(diào)權(quán),將非常有助于提升轉(zhuǎn)化率。
目前業(yè)界的預(yù)測(cè)方案是基于用戶上次登錄或投遞的時(shí)間,計(jì)算該時(shí)間距離當(dāng)前日期的間隔,間隔越長(zhǎng)則今日投遞意愿越低。但實(shí)際上,用戶求職是周期性需求,且受節(jié)假日影響明顯,而該方案對(duì)周期性投遞行為的冷啟動(dòng)和節(jié)假日規(guī)律乏力。另外,用戶在投遞期間的動(dòng)作存在規(guī)律,例如用戶往往在求職初期前投遞頻繁,后期投遞量逐漸減少,且不同用戶的投遞行為存在顯著差異,例如A用戶每日投遞量超過(guò)100但B用戶僅僅每天1-2次投遞,用基于上次投遞時(shí)間的方案無(wú)法對(duì)投遞動(dòng)作的變化做出相應(yīng)的改變,也不能針對(duì)不同的用戶實(shí)現(xiàn)個(gè)性化。
因此,需要提供一種更有效的用戶投遞意愿概率的預(yù)測(cè)方法。
發(fā)明內(nèi)容
為此,本發(fā)明提供一種用戶投遞意愿模型的構(gòu)建方法和計(jì)算設(shè)備,以力圖解決或至少緩解上面存在的問(wèn)題。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種用戶投遞意愿模型的構(gòu)建方法,適于在計(jì)算設(shè)備中執(zhí)行,計(jì)算設(shè)備與數(shù)據(jù)存儲(chǔ)裝置連接,數(shù)據(jù)存儲(chǔ)裝置中存儲(chǔ)有多個(gè)用戶在目標(biāo)網(wǎng)站的操作數(shù)據(jù),操作數(shù)據(jù)包括動(dòng)作數(shù)據(jù)和投遞數(shù)據(jù),該方法包括:獲取多個(gè)用戶在當(dāng)前日期之前預(yù)定天數(shù)內(nèi)的操作數(shù)據(jù),并根據(jù)獲取到的操作數(shù)據(jù)構(gòu)造樣本集,樣本集中的每條樣本包括用戶標(biāo)識(shí)、用戶每天的操作數(shù)據(jù)和用戶在當(dāng)前日期的前一天是否有投遞操作;根據(jù)用戶在當(dāng)前日期的前一天是否有投遞操作將各條樣本標(biāo)記為正樣本或負(fù)樣本,對(duì)負(fù)樣本按照第一比例進(jìn)行抽樣,并將正樣本與抽樣后的負(fù)樣本按照第二比例生成訓(xùn)練集;根據(jù)訓(xùn)練集中的操作數(shù)據(jù)計(jì)算各條樣本的多個(gè)特征值,并將正負(fù)樣本標(biāo)識(shí)和多個(gè)特征值構(gòu)造為樣本的特征向量;以及采用預(yù)定算法對(duì)訓(xùn)練集中各樣本的特征向量進(jìn)行訓(xùn)練,得到用戶投遞意愿模型,用戶投遞意愿模型的輸入為目標(biāo)用戶的多個(gè)特征值,輸出為該用戶的投遞意愿概率值。
可選地,在根據(jù)本發(fā)明的用戶投遞意愿模型的構(gòu)建方法中,動(dòng)作數(shù)據(jù)包括動(dòng)作類型和動(dòng)作時(shí)間,動(dòng)作類型包括點(diǎn)擊、收藏、瀏覽,操作數(shù)據(jù)還包括登錄數(shù)據(jù),登錄數(shù)據(jù)包括登錄時(shí)間,投遞數(shù)據(jù)包括投遞時(shí)間。
可選地,在根據(jù)本發(fā)明的用戶投遞意愿模型的構(gòu)建方法中,多個(gè)特征值包括以下特征值中的至少兩個(gè):當(dāng)前日期是星期幾;當(dāng)前日期距離注冊(cè)日的天數(shù);投遞總次數(shù);平均每天投遞次數(shù);當(dāng)前日期距離上次投遞的天數(shù);當(dāng)前日期距離上次動(dòng)作的天數(shù);最大連續(xù)動(dòng)作天數(shù);有過(guò)動(dòng)作的天數(shù);有過(guò)投遞的天數(shù);平均投遞天數(shù);平均動(dòng)作天數(shù)。
可選地,在根據(jù)本發(fā)明的用戶投遞意愿模型的構(gòu)建方法中,還包括步驟:將多個(gè)特征值中的每個(gè)特征值分別除以訓(xùn)練集中對(duì)應(yīng)特征值的最大值,以將各特征值進(jìn)行歸一化。
可選地,在根據(jù)本發(fā)明的用戶投遞意愿模型的構(gòu)建方法中,預(yù)定算法為GBDT回歸算法。
可選地,在根據(jù)本發(fā)明的用戶投遞意愿模型的構(gòu)建方法中,采用預(yù)定算法對(duì)訓(xùn)練集中各樣本的特征向量進(jìn)行訓(xùn)練的步驟包括:采用不同的GBDT算法參數(shù),分別對(duì)訓(xùn)練集中各樣本的特征向量進(jìn)行訓(xùn)練,得到每種算法參數(shù)對(duì)應(yīng)的用戶投遞意愿模型;設(shè)定不同的判定閾值,對(duì)于每種算法參數(shù)對(duì)應(yīng)的用戶投遞意愿模型,計(jì)算訓(xùn)練集中各條樣本在該模型下的投遞意愿概率值,并計(jì)算每種判定閾值下對(duì)是否產(chǎn)生投遞的預(yù)測(cè)結(jié)果與真實(shí)值的誤差值;以及選取誤差值最小時(shí)的算法參數(shù)和判定閾值分別作為生效算法參數(shù)和生效判定閾值,并將生效算法參數(shù)對(duì)應(yīng)的用戶投遞意愿模型作為生效用戶投遞意愿模型。
可選地,在根據(jù)本發(fā)明的用戶投遞意愿模型的構(gòu)建方法中,還包括步驟:從數(shù)據(jù)存儲(chǔ)裝置中獲取全部用戶的操作數(shù)據(jù),并根據(jù)該操作數(shù)據(jù)計(jì)算各用戶的多個(gè)特征值;以及分別將各用戶的多個(gè)特征值輸入到生效用戶投遞意愿模型中,計(jì)算得到各用戶的投遞意愿概率值,并根據(jù)生效判定閾值預(yù)測(cè)各用戶是否會(huì)在當(dāng)前日期進(jìn)行投遞操作。
根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器;和一個(gè)或多個(gè)程序,其中所述一個(gè)或多個(gè)程序存儲(chǔ)在所述存儲(chǔ)器中并被配置為由所述一個(gè)或多個(gè)處理器執(zhí)行,所述一個(gè)或多個(gè)程序包括用于執(zhí)行如上所述的用戶投遞意愿模型的構(gòu)建方法的指令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京拉勾科技有限公司,未經(jīng)北京拉勾科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710827720.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門(mén)票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 一種對(duì)多種來(lái)源的多類投遞請(qǐng)求進(jìn)行處理的方法和系統(tǒng)
- 一種智能包裹投遞系統(tǒng)的包裹投遞方法
- 一種高效的快遞防盜投遞方法與系統(tǒng)
- 快件投遞、投遞處理、投遞執(zhí)行方法和設(shè)備及快遞系統(tǒng)
- 一種數(shù)據(jù)校驗(yàn)方法、系統(tǒng)和裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 分揀系統(tǒng)及機(jī)器人
- 快件投遞的預(yù)約方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種智能投遞柜投遞方法、裝置及智能投遞柜
- 包裹重投遞方法、包裹投遞方法以及相關(guān)設(shè)備
- 一種投遞員投遞打卡系統(tǒng)及其打卡方法
- 一種基于用戶狀態(tài)呈現(xiàn)實(shí)現(xiàn)主被叫呼叫處理的方法和系統(tǒng)
- 一種用戶數(shù)據(jù)文件的訪問(wèn)控制方法
- 基于意愿點(diǎn)數(shù)的選課方法和系統(tǒng)
- 市場(chǎng)仿真模擬系統(tǒng)
- 預(yù)估司機(jī)接單意愿的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種酒店客戶旅游拼團(tuán)出行系統(tǒng)
- 一種訂單分配方法和裝置
- 大學(xué)生購(gòu)車意愿評(píng)估方法及裝置
- 一種提高用戶動(dòng)支率的方法、裝置、系統(tǒng)和記錄介質(zhì)
- 用于智能自助設(shè)備的語(yǔ)音交互方法和裝置





