[發明專利]簡歷評估方法、裝置、電子設備及計算機存儲介質在審
| 申請號: | 201910828387.2 | 申請日: | 2019-09-03 |
| 公開(公告)號: | CN110516261A | 公開(公告)日: | 2019-11-29 |
| 發明(設計)人: | 于劭煒 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 11330 北京市立方律師事務所 | 代理人: | 張筱寧<國際申請>=<國際公布>=<進入 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 技能 文本內容 評估 計算機存儲介質 信息處理技術 電子設備 簡歷文本 預定概率 詞識別 詞匯 歸屬 概率 | ||
1.一種簡歷評估方法,其特征在于,包括:
確定獲取到的至少一份簡歷的文本內容;
基于訓練后的預定技術領域的技能詞識別模型,確定各份簡歷的文本內容分別包括的至少一個技能詞,所述至少一個技能詞是歸屬于所述預定技術領域的概率不小于預定概率閾值的技能詞;
依據各份簡歷的文本內容分別包括的各個技能詞,對相應的各份簡歷分別進行評估。
2.根據權利要求1所述的方法,其特征在于,基于訓練后的預定技術領域的技能詞識別模型,確定各份簡歷的文本內容分別包括的至少一個技能詞,包括:
基于訓練后的預定技術領域的技能詞識別模型,確定各份簡歷的文本內容分別包括的多個待識別詞屬于所述預定技術領域的識別概率;
將識別概率不小于預定概率閾值的待識別詞確定為技能詞。
3.根據權利要求1所述的方法,其特征在于,在基于訓練后的預定技術領域的技能詞識別模型,確定各份簡歷的文本內容分別包括的至少一個技能詞之前,還包括:
基于技能詞詞典與停用詞表,根據預定技術領域的預設數量的樣本簡歷,對技能詞識別模型進行訓練,得到訓練后的預定技術領域的技能詞識別模型;
所述技能詞詞典是根據獲取到的所述預定技術領域的多個技能詞生成的詞典,所述停用詞表是根據獲取到的所述預定技術領域的多個停用詞生成的詞表。
4.根據權利要求3所述的方法,其特征在于,基于所述技能詞詞典與所述停用詞表,根據預定技術領域的預設數量的樣本簡歷,對技能詞識別模型進行訓練,包括:
基于所述技能詞詞典,對各個樣本簡歷的文本內容分別進行分詞,得到各個樣本簡歷分別對應的多個分詞;
根據所述停用詞表,對各個樣本簡歷分別對應的多個分詞進行停用詞濾除;
基于濾除停用詞后的各個樣本簡歷分別對應的多個分詞,對技能詞識別模型進行訓練。
5.根據權利要求4所述的方法,其特征在于,基于濾除停用詞后的任一樣本簡歷的多個分詞,對技能詞識別模型進行訓練,包括:
基于所述技能詞詞典,從濾除停用詞后的任一樣本簡歷的多個分詞中提取屬于所述預定技術領域的至少一個技能詞;
根據所述至少一個技能詞,對技能詞識別模型進行訓練。
6.根據權利要求5所述的方法,其特征在于,根據所述至少一個技能詞,對技能詞識別模型進行訓練,包括:
根據所述至少一個技能詞,對所述任一樣本簡歷的文本內容分別進行技能詞標注;
根據標注技能詞后的所述任一樣本簡歷的文本內容,對技能詞識別模型進行訓練。
7.根據權利要求1所述的方法,其特征在于,在基于訓練后的技能詞識別模型,確定各份簡歷的文本內容分別包括的至少一個技能詞之后,還包括:
確定各份簡歷的文本內容分別包括的各個技能詞是否正確,并根據確定正確的技能詞對所述技能詞詞典進行更新;
基于停用詞表與更新后的技能詞詞典,根據預定技術領域的預設數量的樣本簡歷,對技能詞識別模型進行訓練,以更新訓練后的技能詞識別模型。
8.根據權利要求1-6任一項所述的方法,其特征在于,所述技能詞識別模型包括根據長短期記憶網絡LSTM算法與條件隨機場CRF算法形成的模型。
9.一種簡歷評估裝置,其特征在于,包括:
第一確定模塊,用于確定獲取到的至少一份簡歷的文本內容;
第二確定模塊,用于基于訓練后的預定技術領域的技能詞識別模型,確定各份簡歷的文本內容分別包括的至少一個技能詞,所述至少一個技能詞是歸屬于所述預定技術領域的概率不小于預定概率閾值的技能詞;
評估模塊,用于依據各份簡歷的文本內容分別包括的各個技能詞,對相應的各份簡歷分別進行評估。
10.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現權利要求1-8任一項所述的簡歷評估方法。
11.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,該程序被處理器執行時實現權利要求1-8任一項所述的簡歷評估方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910828387.2/1.html,轉載請聲明來源鉆瓜專利網。





