[發(fā)明專利]簡歷數(shù)據(jù)信息解析處理方法、裝置、設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810548844.8 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN108874928A | 公開(公告)日: | 2018-11-23 |
| 發(fā)明(設計)人: | 張師琲 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q10/10 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 簡歷文本 有效關(guān)鍵詞 標題標簽 簡歷數(shù)據(jù) 信息解析 存儲介質(zhì) 數(shù)據(jù)信息 預設 解析 計算機技術(shù)領(lǐng)域 數(shù)據(jù)解析方式 計算機設備 標簽提取 格式轉(zhuǎn)換 接收用戶 匹配成功 文本格式 準確率 上傳 匹配 | ||
本發(fā)明涉及計算機技術(shù)領(lǐng)域,提供了一種簡歷數(shù)據(jù)信息解析處理方法、裝置、計算機設備及存儲介質(zhì),所述簡歷數(shù)據(jù)信息解析處理方法包括:接收用戶上傳的簡歷文件;按照預設的文本格式,對簡歷文件進行格式轉(zhuǎn)換,得到簡歷文件對應的簡歷文本;對簡歷文本進行標簽提取,得到標題標簽;根據(jù)預設的關(guān)鍵詞,將標題標簽與關(guān)鍵詞進行匹配,將匹配成功的標題標簽確定為有效關(guān)鍵詞;針對每個有效關(guān)鍵詞,按照該有效關(guān)鍵詞對應的數(shù)據(jù)解析方式,對簡歷文本進行解析,獲取簡歷文本中每個有效關(guān)鍵詞對應的數(shù)據(jù)信息。本發(fā)明實現(xiàn)了對簡歷文本數(shù)據(jù)信息的完整提取,有效提高對簡歷文本的解析準確率。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種簡歷數(shù)據(jù)信息解析處理方法、裝置、設備及存儲介質(zhì)。
背景技術(shù)
在日常生活中,簡歷是作者用于求職或展示人生閱歷的一類重要文本,它包含了作者的基本情況、工作經(jīng)驗和教育經(jīng)驗等信息,而各種個人簡歷的設計風格以及個人的書寫習慣會不同,個人簡歷信息的具體格式也因人而異,各企業(yè)想要獲取人才資料,需要管理人員從大量的簡歷中篩選解析出所需的簡歷信息。
目前,傳統(tǒng)的簡歷數(shù)據(jù)解析方法通常由人工完成,手動收集簡歷文件并對簡歷文件中的簡歷文本進行人工分類處理,手動分類錄入簡歷數(shù)據(jù)信息存入數(shù)據(jù)庫,由于人工分類處理往往帶有主觀因素,也容易出現(xiàn)信息重復錄入或信息缺失的情況,導致簡歷數(shù)據(jù)信息解析準確率不高。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種可以提高簡歷數(shù)據(jù)信息解析準確率的簡歷數(shù)據(jù)信息解析處理方法、裝置、設備及存儲介質(zhì)。
一種簡歷數(shù)據(jù)信息解析處理方法,包括:
接收用戶上傳的簡歷文件;
按照預設的文本格式,對所述簡歷文件進行格式轉(zhuǎn)換,得到所述簡歷文件對應的簡歷文本;
對所述簡歷文本進行標簽提取,得到標題標簽;
根據(jù)預設的關(guān)鍵詞,將所述標題標簽與所述關(guān)鍵詞進行匹配,將匹配成功的所述標題標簽確定為有效關(guān)鍵詞;
針對每個所述有效關(guān)鍵詞,按照該有效關(guān)鍵詞對應的數(shù)據(jù)解析方式,對所述簡歷文本進行解析,獲取所述簡歷文本中每個所述有效關(guān)鍵詞對應的所述數(shù)據(jù)信息;
根據(jù)預設的標準簡歷模板中模板標簽,將所述有效關(guān)鍵詞與所述模板標簽進行匹配,并將匹配成功的所述有效關(guān)鍵詞對應的所述數(shù)據(jù)信息導入所述模板標簽對應的位置,生成標準簡歷報告并保存在簡歷庫中。
一種簡歷數(shù)據(jù)信息解析處理裝置,包括:
文件接收模塊,用于接收用戶上傳的簡歷文件;
文件轉(zhuǎn)換模塊,用于按照預設的文本格式,對所述簡歷文件進行格式轉(zhuǎn)換,得到所述簡歷文件對應的簡歷文本;
標簽提取模塊,用于對所述簡歷文本進行標簽提取,得到標題標簽;
標簽匹配模塊,用于根據(jù)預設的關(guān)鍵詞,將所述標題標簽與所述關(guān)鍵詞進行匹配,將匹配成功的所述標題標簽確定為有效關(guān)鍵詞;
文本解析模塊,用于針對每個所述有效關(guān)鍵詞,按照該有效關(guān)鍵詞對應的數(shù)據(jù)解析方式,對所述簡歷文本進行解析,獲取所述簡歷文本中每個所述有效關(guān)鍵詞對應的所述數(shù)據(jù)信息;
信息導入模塊,用于根據(jù)預設的標準簡歷模板中模板標簽,將所述有效關(guān)鍵詞與所述模板標簽進行匹配,并將匹配成功的所述有效關(guān)鍵詞對應的所述數(shù)據(jù)信息導入所述模板標簽對應的位置,生成標準簡歷報告并保存在簡歷庫中。
一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述簡歷數(shù)據(jù)信息解析處理方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810548844.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于選擇用于網(wǎng)絡發(fā)布的關(guān)鍵詞的方法和設備
- 用于確定目標推廣信息的關(guān)鍵詞匹配模式的方法和設備
- 有效關(guān)鍵詞選擇系統(tǒng)及有效關(guān)鍵詞選擇方法
- 生成提示關(guān)鍵詞、建立索引關(guān)系的方法、服務器和客戶端
- 關(guān)鍵詞提取方法和裝置
- 一種關(guān)鍵詞抽取方法和裝置
- 基于頻繁集挖掘的關(guān)鍵詞規(guī)則生成方法及其裝置
- 發(fā)音評估方法、裝置、電子設備和介質(zhì)
- 一種長尾關(guān)鍵詞識別方法、關(guān)鍵詞搜索方法及計算機設備
- 關(guān)鍵詞推薦效果評估方法、系統(tǒng)、電子設備及存儲介質(zhì)





