[發明專利]一種基于垂直搜索引擎的簡歷解析系統在審

申請號：	201910302297.X	申請日：	2019-04-16
公開（公告）號：	CN110020327A	公開（公告）日：	2019-07-16
發明（設計）人：	申剛正	申請（專利權）人：	上海大易云計算股份有限公司
主分類號：	G06F16/957	分類號：	G06F16/957;G06F17/27
代理公司：	暫無信息	代理人：	暫無信息
地址：	200120 上海市浦東***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	簡歷內容垂直搜索引擎抽取單元分割單元解析系統文件文本優化單元解析格式化解析信息鏈接獲取統一轉換文本內容文本轉換自動識別內容項鏈接記錄分析文本教育渠道統一
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種基于垂直搜索引擎的簡歷解析系統，包括簡歷文件文本抽取單元、簡歷內容分割單元和簡歷內容分析優化單元；簡歷文件文本抽取單元，對于一些渠道的簡歷，郵件中沒有實際的簡歷內容而只有鏈接，通過打開鏈接獲取真實簡歷的內容；簡歷內容分割單元用于設定簡歷解析信息集的關鍵字，例如工作經歷、教育經歷，使用這些關鍵字區分簡歷的大類別；簡歷內容分析優化單元用于解析多條記錄的內容項，如工作經歷、教育經歷首先進行記錄劃分；本發明可以自動識別不同格式的簡歷，使用文本轉換技術，統一轉換成文本，然后將文本內容解析成格式化的簡歷，用統一的格式將簡歷內容展現出來。

技術領域

本發明涉及信息檢索領域，具體為一種基于垂直搜索引擎的簡歷解析系統。

背景技術

目前招聘的效率不高，主要原因在候選人和企業不能很好的匹配，求職者需要在不同的招聘網站投遞職位，而且相同的職位有好幾十上百頁，由于信息大致相同，候選人為了省事，因此簡歷“海投”，公司HR則“海選”，雙方都費時費力，效率低下。

缺點一、不同格式的簡歷，需要不同的工具查看，例如使用Office查看word、excel格式的簡歷，使用Re1der查看pdf的簡歷，使用瀏覽器查看html、mht格式的簡歷等等。

缺點二、簡歷內容、簡歷格式多種多樣，例如聯系方式、年齡、工作年限、求職意向等關鍵信息，有些在簡歷內容的最后，有些夾雜在自我評價中，有些甚至沒有直接描述。

缺點三、簡歷存儲分散，文件格式多樣，不易管理、不易查找。

缺點四、經常收到同一個人的不同渠道的簡歷，不易判斷這個人是否投遞過職位，是否已經在該職位上被淘汰。

發明內容

本發明的目的在于提供一種基于垂直搜索引擎的簡歷解析系統，以解決上述背景技術中提出的問題。

為實現上述目的，本發明提供如下技術方案：一種基于垂直搜索引擎的簡歷解析系統，包括簡歷文件文本抽取單元、簡歷內容分割單元和簡歷內容分析優化單元；

簡歷文件文本抽取單元，對于一些渠道的簡歷，郵件中沒有實際的簡歷內容而只有鏈接，通過打開鏈接獲取真實簡歷的內容；