[發(fā)明專利]一種電子簡歷的篩選方法及裝置在審
| 申請?zhí)枺?/td> | 202011008492.0 | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112115705A | 公開(公告)日: | 2020-12-22 |
| 發(fā)明(設(shè)計(jì))人: | 井玉欣;崔妲珅;張煒 | 申請(專利權(quán))人: | 普信恒業(yè)科技發(fā)展(北京)有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/295;G06F16/335;G06F16/35;G06Q10/10 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 林哲生 |
| 地址: | 100026 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電子 簡歷 篩選 方法 裝置 | ||
1.一種電子簡歷的篩選方法,其特征在于,包括:
獲取待篩選電子簡歷;
對所述待篩選電子簡歷進(jìn)行解析,得到所述待篩選電子簡歷對應(yīng)的目標(biāo)崗位以及多個(gè)預(yù)設(shè)字段數(shù)據(jù);
根據(jù)每個(gè)所述預(yù)設(shè)字段數(shù)據(jù)的類型對應(yīng)的特征提取方式,分別對每個(gè)所述預(yù)設(shè)字段數(shù)據(jù)進(jìn)行特征提取,得到所述待篩選電子簡歷的特征數(shù)據(jù),所述特征提取方式包括:結(jié)構(gòu)化特征提取、半結(jié)構(gòu)化特征提取和非結(jié)構(gòu)化特征提取;
將所述待篩選電子簡歷的特征數(shù)據(jù)輸入到所述目標(biāo)崗位對應(yīng)的簡歷篩選模型中進(jìn)行處理,得到表示所述待篩選電子簡歷是否通過篩選的處理結(jié)果,所述目標(biāo)崗位對應(yīng)的簡歷篩選模型的訓(xùn)練數(shù)據(jù)中的正樣本為通過所述目標(biāo)崗位篩選的電子簡歷的特征數(shù)據(jù),負(fù)樣本為未通過所述目標(biāo)崗位篩選的電子簡歷的特征數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述待篩選電子簡歷進(jìn)行解析,得到所述待篩選電子簡歷對應(yīng)的目標(biāo)崗位以及多個(gè)預(yù)設(shè)字段數(shù)據(jù),包括:
提取所述待篩選電子簡歷的文本信息;
從所述文本信息中提取崗位數(shù)據(jù),確定所述待篩選電子簡歷對應(yīng)的所述目標(biāo)崗位;
判斷所述文本信息的格式是否滿足預(yù)設(shè)簡歷格式;
若滿足所述預(yù)設(shè)簡歷格式,根據(jù)所述預(yù)設(shè)簡歷格式中預(yù)設(shè)字段與位置之間的對應(yīng)關(guān)系,從所述文本信息中提取多個(gè)所述預(yù)設(shè)字段數(shù)據(jù);
若不滿足所述預(yù)設(shè)簡歷格式,采用基于規(guī)則與關(guān)鍵字的方式從所述文本信息中提取多個(gè)所述預(yù)設(shè)字段數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述預(yù)設(shè)字段數(shù)據(jù)的類型為結(jié)構(gòu)化數(shù)據(jù)時(shí),對所述預(yù)設(shè)字段數(shù)據(jù)進(jìn)行結(jié)構(gòu)化特征提取,包括:
提取所述預(yù)設(shè)字段數(shù)據(jù)中的預(yù)設(shè)屬性特征數(shù)據(jù);
對所述預(yù)設(shè)屬性特征數(shù)據(jù)進(jìn)行特征編碼,得到所述預(yù)設(shè)字段數(shù)據(jù)的特征數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述預(yù)設(shè)字段數(shù)據(jù)的類型為半結(jié)構(gòu)化數(shù)據(jù)時(shí),對所述預(yù)設(shè)字段數(shù)據(jù)進(jìn)行半結(jié)構(gòu)化特征提取,包括:
對所述預(yù)設(shè)字段數(shù)據(jù)進(jìn)行命名實(shí)體識別,得到多個(gè)實(shí)體;
根據(jù)預(yù)先設(shè)定的實(shí)體與特征名稱的對應(yīng)關(guān)系以及實(shí)體與特征值的對應(yīng)關(guān)系,確定每個(gè)特征名稱對應(yīng)的特征值;
對每個(gè)特征名稱對應(yīng)的特征值進(jìn)行特征編碼,得到所述預(yù)設(shè)字段數(shù)據(jù)的特征數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)所述預(yù)設(shè)字段數(shù)據(jù)的類型為非結(jié)構(gòu)化數(shù)據(jù)時(shí),對所述預(yù)設(shè)字段數(shù)據(jù)進(jìn)行非結(jié)構(gòu)化特征提取,包括:
對所述預(yù)設(shè)字段進(jìn)行分詞處理、新詞發(fā)現(xiàn)處理和去停用詞處理,得到多個(gè)成詞;
對多個(gè)成詞進(jìn)行聚類處理,得到多個(gè)詞類;
對每個(gè)詞類進(jìn)行正負(fù)樣本上的分布統(tǒng)計(jì),根據(jù)每個(gè)詞類的分布統(tǒng)計(jì)結(jié)果剔除低區(qū)分度詞;
根據(jù)JS散度算法,計(jì)算剔除低區(qū)分度詞后的每個(gè)詞類的JS散度,并將JS散度大于預(yù)設(shè)值的詞類確定為待提取詞類;
分別計(jì)算每個(gè)待提取詞類的詞頻得分,得到所述預(yù)設(shè)字段的特征數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述待篩選電子簡歷的特征數(shù)據(jù)輸入到所述目標(biāo)崗位對應(yīng)的簡歷篩選模型中進(jìn)行處理,得到表示所述待篩選電子簡歷是否通過篩選的處理結(jié)果,包括:
判斷所述待篩選電子簡歷的特征數(shù)據(jù)是否符合預(yù)先設(shè)定的前置規(guī)則;
若符合所述前置規(guī)則,將所述待篩選電子簡歷的特征數(shù)據(jù)輸入到所述目標(biāo)崗位對應(yīng)的簡歷篩選模型中進(jìn)行處理,得到表示所述待篩選電子簡歷是否通過篩選的處理結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于普信恒業(yè)科技發(fā)展(北京)有限公司,未經(jīng)普信恒業(yè)科技發(fā)展(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011008492.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種太陽能電池以及制作方法
- 下一篇:一種重金屬離子吸附膜及其制備方法
- 一種在多種電子設(shè)備,尤其是在電子服務(wù)提供商的電子設(shè)備和電子服務(wù)用戶的電子設(shè)備之間建立受保護(hù)的電子通信的方法
- 一種電子打火機(jī)及其裝配方法
- 電子檔案管理系統(tǒng)
- 在處理系統(tǒng)化學(xué)分析中使用的電子束激勵(lì)器
- 電子文件管理方法和管理系統(tǒng)
- 一種有效電子憑據(jù)生成、公開驗(yàn)證方法、裝置及系統(tǒng)
- 電子文憑讀寫控制系統(tǒng)和方法
- 具有加密解密功能的智能化電子證件管理裝置
- 一種基于數(shù)字證書的電子印章方法及電子印章系統(tǒng)
- 一種電子印章使用方法、裝置及電子設(shè)備
- 一種視頻簡歷制作和發(fā)布的方法及系統(tǒng)
- 一種求職簡歷的組合式制作發(fā)布系統(tǒng)及方法
- 簡歷識別裝置、方法及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種基于簡歷隱私保護(hù)的簡歷分享方法
- 一種簡歷狀態(tài)的反饋方法、裝置、存儲介質(zhì)及服務(wù)器
- 簡歷審核的方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 簡歷生成方法、系統(tǒng)、計(jì)算機(jī)設(shè)備以及產(chǎn)品
- 一種基于垂直搜索引擎的簡歷解析系統(tǒng)
- 一種簡歷生成方法、裝置、客戶端、服務(wù)器及存儲介質(zhì)
- 一種簡歷查重方法





