[發明專利]一種學生工作崗位推薦的方法和裝置在審
| 申請號: | 202011556026.6 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112686624A | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 湯若聰;宋晨靜;劉林峰;黃敏;李桐;巨澤建;侯登學;張宜紅;王曉東 | 申請(專利權)人: | 江蘇金智教育信息股份有限公司 |
| 主分類號: | G06Q10/10 | 分類號: | G06Q10/10;G06K9/62;G06N3/04 |
| 代理公司: | 江蘇銀創律師事務所 32242 | 代理人: | 孫計良 |
| 地址: | 211100 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 學生 工作崗位 推薦 方法 裝置 | ||
1.一種學生工作崗位推薦的方法,其特征在于,該方法包括數據預處理步驟、模型訓練步驟和崗位推薦分析步驟;所述數據預處理步驟包括聯合特征預處理步驟、聯合特征數值化樣本生成步驟以及聯合特征離散化樣本生成步驟;
所述聯合特征預處理步驟用于根據聯合特征表和聯合特征相關性值表對所述聯合特征相關性值表中的聯合特征之間的相關性值進行二值化處理得到聯合特征之間的相關性二值化值ci,k;若ri,k<Rthreshold,則ci,k=1,否則ci,k=0;其中,ci,k為第i個聯合特征和第k個聯合特征的相關性二值化值,ri,k表示為第i個聯合特征和第k個聯合特征的相關性值,i∈[1..N],k∈[1..N],N是所述聯合特征表中聯合特征數,Rthreshold是預先設定的閾值;
所述聯合特征數值化樣本生成步驟用于根據輸入的學生的畫像信息和崗位的特征信息,基于所述聯合特征表構建聯合樣本的數值化向量;
所述聯合特征離散化樣本生成步驟用于根據輸入的學生的畫像信息、崗位的特征信息,基于所述聯合特征表構建聯合樣本的低維稠密的實數化嵌入向量;
所述模型訓練步驟包括以下步驟:
S21:獲取歷史學生的畫像信息以及歷史學生與崗位的交互關注記錄;所述交互關注記錄包括關注記錄和交互記錄;
S22:若某個歷史學生is和某個崗位iw之間存在相應的交互關注記錄,則通過所述聯合特征數值化樣本生成步驟生成聯合樣本的數值化向量Sp、通過所述聯合特征離散化樣本生成步驟生成聯合樣本對應的低維稠密的實數化嵌入向量Ep和該聯合樣本的樣本標簽Yp;各聯合樣本的數值化向量Sp、低維稠密的實數化嵌入向量Ep和該聯合樣本的樣本標簽Yp組成聯合樣本集S={{Sp,Ep,Yp,is,iw}|p∈[1..Q]},Q為聯合樣本數;
Sp為第p個聯合樣本的數值化向量:
Sp=[sp,1,sp,2,...sp,N]=[xis,1,xis,2,...xis,A,miw,1,miw,2,...miw,B];其中,
sp,i為第p個聯合樣本數值化向量中的第i個聯合特征的數值化值,i∈[1..N];
A為學生的特征數,xis,u為學生is的第u個數值化特征,u∈[1..A];
B為崗位的特征數,miw,v為崗位iw的第v個數值化特征,v∈[1..B];
學生的特征數A、崗位的特征數B以及聯合特征數N滿足:N=A+B;
is和iw分別表示為學生和崗位的識別碼;
Yp為第p個聯合樣本的樣本標簽:
若該學生is和該崗位iw之間存在交互記錄,則樣本標簽Yp=1,否則樣本標簽Yp=0;
S23:根據所述聯合特征之間的相關性二值化值,計算所述聯合樣本集S中各個聯合樣本的交叉特征值,得到各個聯合樣本的交叉特征向量φp;其中,
φp為第p個聯合樣本的交叉特征向量,φp=[φp,1,φp,2,…,φp,N];其中,
φp,k為第p個聯合樣本的第k個聯合特征的交叉特征值,采用如下公式計算:
其中,
sp,i為第p個聯合樣本數值化向量中的第i個聯合特征的數值化值;
ci,k為第i個聯合特征和第k個聯合特征的相關性二值化值;
p∈[1..Q],i∈[1..N],k∈[1..N];
S24:根據各個聯合樣本的數值化向量和各個聯合樣本的交叉特征向量以及各聯合樣本對應的樣本標簽,通過對線性模型進行回歸分析,得到第一權重向量Wwd和第一偏置項b;其中,為第一權重向量Wwd的轉置,Yp為第p個聯合樣本的樣本標簽,Sφp是聯合樣本的數值化向量Sp和交叉特征向量φp的連接,Sp為第p個聯合樣本的數值化向量;
S25:將各個聯合樣本對應的低維稠密的實數化嵌入向量逐個輸入至深度神經網絡模塊中進行訓練;所述深度神經網絡模塊中,包括若干隱藏層;每一隱藏層做如下處理:
al+1=Activation(Normalization(Cut(dl,Activation(WlTal+bl))));
其中,Activation為激活函數,Normalization為歸一化函數,Cut為向量長度調整函數,l表示隱藏層的層次,al為第l隱藏層的輸入向量,al+1為第l隱藏層的輸出向量,第一隱藏層的輸入向量a1為所輸入的低維稠密的實數化嵌入向量的融合,dl為向量長度調整函數Cut所調整的向量長度,WlT為向量Wl的轉置,Wl和bl由深度神經網絡模塊自動確定;
S26:訓練結束后提取深度神經網絡模塊中的Wl和al并計算出bd=WlTal;
所述崗位推薦分析步驟包括如下步驟:
S31:獲取被分析學生的畫像信息;
S32:根據所述聯合特征數值化樣本生成步驟生成該被分析學生與各個崗位之間的聯合樣本的數值化向量st,iw;其中,st,iw為被分析學生t的對崗位iw的聯合樣本的數值化向量;
S33:根據所述聯合特征之間的相關性二值化值,計算所述被分析學生與各個崗位之間的聯合樣本的交叉特征值,組成該被分析學生對各個崗位的聯合樣本的交叉特征向量φt,iw
其中,
φt,iw為被分析學生t的對崗位iw的交叉特征向量,φt,iw=[φt,iw,1,φt,tw,2,…,φt,iw,N];其中,
φt,iw,k為被分析學生t的對崗位iw的第k個聯合特征的交叉特征值,采用如下公式計算:
其中,
st,iw,i為被分析學生t的對崗位iw的聯合樣本的的第i個聯合特征的數值化值,
ci,k為第i個聯合特征和第k個聯合特征的相關性二值化值;k∈[1..N];
S34:根據該被分析學生與各個崗位之間的聯合樣本的數值化向量和該被分析學生對各個崗位的聯合樣本的交叉特征向量,計算出該被分析學生從事各個崗位的概率:
其中,Pt,iw為被分析學生t從事崗位iw的概率;
Sφt,iw是聯合樣本的數值化向量st,iw和交叉特征向量φt,iw的連接;
st,iw為被分析學生t的對崗位iw的聯合樣本的數值化向量;
φt,iw為被分析學生t的對崗位iw的交叉特征向量;
S35:根據所述被分析學生從事各個崗位的概率大小對崗位進行降序排序,選取其中前TopN個崗位作為該被分析學生的工作崗位推薦結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇金智教育信息股份有限公司,未經江蘇金智教育信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011556026.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種斜面抬升的升降桌面
- 下一篇:一種珍珠棉發泡機用截斷裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





