[發明專利]簡歷數據信息解析處理方法、裝置、設備及存儲介質在審
| 申請號: | 201810548844.8 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN108874928A | 公開(公告)日: | 2018-11-23 |
| 發明(設計)人: | 張師琲 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q10/10 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 簡歷文本 有效關鍵詞 標題標簽 簡歷數據 信息解析 存儲介質 數據信息 預設 解析 計算機技術領域 數據解析方式 計算機設備 標簽提取 格式轉換 接收用戶 匹配成功 文本格式 準確率 上傳 匹配 | ||
1.一種簡歷數據信息解析處理方法,其特征在于,所述簡歷數據信息解析處理方法包括:
接收用戶上傳的簡歷文件;
按照預設的文本格式,對所述簡歷文件進行格式轉換,得到所述簡歷文件對應的簡歷文本;
對所述簡歷文本進行標簽提取,得到標題標簽;
根據預設的關鍵詞,將所述標題標簽與所述關鍵詞進行匹配,將匹配成功的所述標題標簽確定為有效關鍵詞;
針對每個所述有效關鍵詞,按照該有效關鍵詞對應的數據解析方式,對所述簡歷文本進行解析,獲取所述簡歷文本中每個所述有效關鍵詞對應的所述數據信息;
根據預設的標準簡歷模板中模板標簽,將所述有效關鍵詞與所述模板標簽進行匹配,并將匹配成功的所述有效關鍵詞對應的所述數據信息導入所述模板標簽對應的位置,生成標準簡歷報告并保存在簡歷庫中。
2.如權利要求1所述的簡歷數據信息解析處理方法,其特征在于,所述對所述簡歷文本進行標簽提取,得到標題標簽包括:
獲取所述簡歷文本中的文本行;
按照預設的特征指標對所述文本行進行特征提取,得到特征向量;
若所述特征向量滿足預設的標簽條件,則將所述文本行標識為所述標題標簽。
3.如權利要求1所述的簡歷數據信息解析處理方法,其特征在于,所述有效關鍵詞包括姓名,所述針對每個所述有效關鍵詞,按照該有效關鍵詞對應的數據解析方式,對所述簡歷文本進行解析,獲取所述簡歷文本中每個所述有效關鍵詞對應的所述數據信息包括:
獲取所述姓名對應的名字數據塊;
根據預設的姓名正則表達式,對所述名字數據塊進行姓名數據識別,將識別出的所述姓名數據作為所述姓名對應的數據信息。
4.如權利要求1所述的簡歷數據信息解析處理方法,其特征在于,所述有效關鍵詞包括教育經歷或工作經歷,所述針對每個所述有效關鍵詞,按照該有效關鍵詞對應的數據解析方式,對所述簡歷文本進行解析,獲取所述簡歷文本中每個所述有效關鍵詞對應的所述數據信息包括:
獲取所述教育簡歷或所述工作經歷對應的數據塊;
根據預設的分值算法,對所述數據塊進行分值計算,得到所述數據塊的分數值;
若所述分數值大于預設的分數閾值,則將該分數值對應的目標數據塊,確定為所述教育簡歷或所述工作經歷對應的所述數據信息。
5.如權利要求4所述的簡歷數據信息解析處理方法,其特征在于,所述數據信息包括主時間段和每個主時間段對應的階段數據信息,所述若所述分數值大于預設的分數閾值,則將該分數值對應的目標數據塊,確定為所述教育簡歷或所述工作經歷對應的所述數據信息之后,所述簡歷數據信息解析處理方法還包括:
根據預設的時間正則表達式,識別所述目標數據塊中的基礎時間段;
分析所述基礎時間段的時間包含關系,確定所述基礎時間段中的主時間段和子時間段;
按照所述主時間段對所述目標數據塊進行拆分,得到每個所述主時間段對應的階段數據信息。
6.如權利要求1至5任一項所述的簡歷數據信息解析處理方法,其特征在于,在所述根據預設的標準簡歷模板中模板標簽,將所述有效關鍵詞與所述模板標簽進行匹配,并將匹配成功的所述有效關鍵詞對應的所述數據信息導入所述模板標簽對應的位置,生成標準簡歷報告并保存在簡歷庫中之后,所述簡歷數據信息解析處理方法還包括:
若接收到所述用戶發送的簡歷信息查詢請求,則獲取所述簡歷信息查詢請求中的查詢條件信息,其中,所述查詢條件信息包括查詢條件項和查詢條件值;
將所述查詢條件項與所述標準簡歷報告中的所述模板標簽進行匹配,獲取匹配成功的所述模板標簽對應的目標數據信息;
將所述目標數據信息與所述查詢條件值進行相似度比較,獲取滿足預設相似度條件的目標數據信息所在的標準簡歷報告。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810548844.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于超圖和隨機森林的入侵檢測方法
- 下一篇:一種交互匹配系統和方法





