[發明專利]確定兩份簡歷為相同人才的識別方法及裝置有效
| 申請號: | 201811340166.2 | 申請日: | 2018-11-12 |
| 公開(公告)號: | CN109472310B | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 鄒麗霞;沈劍 | 申請(專利權)人: | 深圳八爪網絡科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 葛勤 |
| 地址: | 518000 廣東省深圳市南山區蛇*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 簡歷 相同 人才 識別 方法 裝置 | ||
本發明公開了一種確定兩份簡歷為相同人才的識別方法及裝置,該方法包括確認兩份待識別簡歷的姓名信息并確定目標特征;根據比對規則計算兩份待識別簡歷的目標特征的相似性,以及根據相似性與姓名信息分別生成對應的第一特征向量、第二特征向量及第三特征向量;利用經訓練的機器學習分類器模型分別對第一特征向量、第二特征向量及第三特征向量進行預測,以確定兩份待識別簡歷是否為相同人才。本發明通過結合人才多種信息能夠智能、快速地識別百萬級別簡歷中的相同人才;在簡歷無需聯系方式時也能從企業人才庫中找到過往人才,幫助獵頭和HR提高招聘效率降低招聘成本;同時為簡歷去重、簡歷作弊識別、人才能力模型構建等人才數據挖掘應用提供基礎。
技術領域
本發明涉及人才簡歷識別技術,尤其涉及一種確定兩份簡歷為相同人才的識別方法、裝置、計算機設備及計算機可讀存儲介質。
背景技術
在人力資源行業,簡歷是企業挑選和甄別求職者的重要依據。過往招聘過程中企業累積了成千上萬甚至更高量級的人才簡歷,人才簡歷獲取時間和來源渠道差異導致這些簡歷內容不盡相同。一方面,企業招聘人員需要耗費大量時間從成千上萬簡歷中辨別相同的人才并尋找合適人選。這降低了人力資源部門的工作效率,提高了企業人才維護成本和招聘成本。另一方面,掌握大量人才簡歷信息的企業可以進行廣泛的數據挖掘應用,比如簡歷作弊識別、人才能力模型構建、人才關系網絡鏈接等等。而識別出規模簡歷中的相同人才是實現這些挖掘應用的基礎。
現有技術中,行業也開始通過姓名、手機號或郵箱來識別相同人才,但是這些方式存在許多問題:姓名表示形式不一致或不完全、手機號變更、多個郵箱交叉使用等情形會導致相同人才錯配及識別不完全等問題。另外,人力資源企業獲取簡歷的渠道多樣,簡歷的不同格式加大了相同簡歷識別的難度;若用人工瀏覽簡歷費時費力,工作效率較低。
有鑒于此,有必要提出對目前的簡歷識別技術進行進一步的改進。
發明內容
為解決上述至少一技術問題,本發明的主要目的是提供一種確定兩份簡歷為相同人才的識別方法、裝置、計算機設備及計算機可讀存儲介質。
為實現上述目的,本發明采用的第一個技術方案為:提供一種確定兩份簡歷為相同人才的識別方法,包括:
確認兩份待識別簡歷的姓名信息,在待識別簡歷的姓名信息為姓名全稱時,根據第一模型特征組合從待識別簡歷中抽取對應的第一目標特征;在識別簡歷的姓名信息為姓氏時,根據第二模型特征組合從待識別簡歷中抽取對應的第二目標特征;在識別簡歷的姓名信息為空白時,根據第三模型特征組合從待識別簡歷中抽取對應的第三目標特征;
根據比對規則計算兩份待識別簡歷的目標特征的相似性,以及根據相似性與姓名信息分別生成對應的第一特征向量、第二特征向量及第三特征向量;
利用經訓練的機器學習分類器模型分別對第一特征向量、第二特征向量及第三特征向量進行預測,以確定兩份待識別簡歷是否為相同人才。
其中,所述第一模型特征組合中有7個模型特征,分別為姓名、教育背景中的學校名稱、專業、教育開始時間、教育開始時間、工作經歷中的所在公司名稱及職位名稱;
所述第二模型特征組合中有7個模型特征,分別為姓氏頻繁度、教育背景中的學校名稱、專業、教育開始時間、教育開始時間、工作經歷中的所在公司名稱及職位名稱,其中,所述姓氏頻繁度為中國姓氏的使用頻率;
所述第三模型特征組合中有8個模型特征,分別為年齡、性別,教育背景中的學校名稱、專業、教育開始時間、教育開始時間、工作經歷中的所在公司名稱及職位名稱,其中,所述年齡與性別兩者的加權對應姓名模型特征。
其中,還包括根據姓氏使用頻率將姓氏頻繁度順次分成多個等級。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳八爪網絡科技有限公司,未經深圳八爪網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811340166.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種X光安檢機圖片物體檢測方法
- 下一篇:一種用戶行為識別方法及裝置





