[發明專利]一種基于專業技能標簽的學生就業能力評估方法及系統在審
| 申請號: | 202211280458.8 | 申請日: | 2022-10-19 |
| 公開(公告)號: | CN115470271A | 公開(公告)日: | 2022-12-13 |
| 發明(設計)人: | 牛紅星;孫兆群;崔一瀾;劉建志 | 申請(專利權)人: | 上海儀電人工智能創新院有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/26;G06N3/04;G06N3/08;G06Q10/06;G06Q10/10 |
| 代理公司: | 上海科盛知識產權代理有限公司 31225 | 代理人: | 趙志遠 |
| 地址: | 200232 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 專業技能 標簽 學生 就業 能力 評估 方法 系統 | ||
1.一種基于專業技能標簽的學生就業能力評估方法,其特征在于,該方法包括以下步驟:
步驟S1、分別采集專業文本數據Dt和畢業生的就業數據DW;
步驟S2、采用無監督的詞匯挖掘算法,從專業文本數據Dt中提取出學生的專業技能標簽W;
步驟S3、將就業數據DW作為監督信號,采用神經網絡算法對提取的專業技能標簽W進行進一步映射,訓練后得到表征學生就業能力的專業技能特征;
步驟S4、基于專業技能特征及權重設置,對學生就業能力進行評價。
2.根據權利要求1所述的一種基于專業技能標簽的學生就業能力評估方法,其特征在于,所述步驟S1中的就業數據包括就業崗位和就業領域。
3.根據權利要求1所述的一種基于專業技能標簽的學生就業能力評估方法,其特征在于,所述步驟S1中的專業文本數據包括內部數據和外部數據;
所述內部數據包括專業介紹、培養方案介紹、選修專業課程相關的文本數據;
所述外部數據包括就業網站上的專業解讀文本數據。
4.根據權利要求3所述的一種基于專業技能標簽的學生就業能力評估方法,其特征在于,所述步驟S2包括以下子步驟:
步驟S21、利用分詞工具對專業文本數據Dt進行停用詞處理以及分詞處理,并基于分詞后的結果構建字典樹;
步驟S22、根據構建的字典樹分別計算左右熵和互信息,并且將左右熵和互信息相加作為得分,排序后選擇分數最高的前N個詞作為候選詞;
步驟S23、對候選詞做語義篩選,利用候選詞對語料進行分詞,訓練word2vec模型,獲得候選詞的詞向量;
步驟S24、從候選詞中選取人工標注部分詞語作為中心詞,利用詞向量計算其它候選詞與中心詞的距離,對候選詞進行篩選;
步驟S25、根據規則或者人工對前面獲得的候選詞作進一步篩選,得到專業技能詞匯;
步驟S26、針對每個學生的內部數據,獲得學生對應的專業技能標簽詞匯W。
5.根據權利要求4所述的一種基于專業技能標簽的學生就業能力評估方法,其特征在于,所述步驟S21中的分詞工具為jieba分詞工具。
6.根據權利要求4所述的一種基于專業技能標簽的學生就業能力評估方法,其特征在于,所述步驟S3包括以下子步驟:
步驟S31、根據畢業生的就業數據DW構造分類學習數據集Dc={W,y},其中,W表示畢業生的專業技能標簽詞匯,y表示畢業生的就業領域;
步驟S32、輸入詞匯列表Wi,經過Bert編碼器網絡后得到專業能力特征x1;
步驟S33、將專業能力特征x1輸入至解碼器網絡,經過softmax激活函數后輸出q(x),采用多分類損失函數進行訓練;
步驟S34、采用訓練后的網絡,將專業能力特征x1作為該學生的就業能力維度中的專業技能維度的特征向量。
7.根據權利要求6所述的一種基于專業技能標簽的學生就業能力評估方法,其特征在于,所述步驟S33中的損失函數表達式為:
式中,p(xi)是類別i的真實標簽;n為類別的數目。
8.一種基于專業技能標簽的學生就業能力評估系統,其特征在于,采用權利要求1~7任一項所述的方法,所述系統包括:
數據采集模塊,用于采集專業文本數據和就業數據;
專業技能標簽提取模塊,用于采用無監督詞匯挖掘算法從專業文本數據中提取出專業技能標簽;
專業技能特征求解模塊,用于結合就業數據對專業技能標簽進行映射以提取表征學生就業能力的專業技能特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海儀電人工智能創新院有限公司,未經上海儀電人工智能創新院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211280458.8/1.html,轉載請聲明來源鉆瓜專利網。





