[發明專利]一種基于聚類算法的員工離職風險預測方法及裝置在審
| 申請號: | 201710967297.2 | 申請日: | 2017-10-17 |
| 公開(公告)號: | CN107886217A | 公開(公告)日: | 2018-04-06 |
| 發明(設計)人: | 李智博;董旭;范成偉;李寶環;王鳳君 | 申請(專利權)人: | 北京德塔精要信息技術有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q10/04;G06Q10/10 |
| 代理公司: | 北京路浩知識產權代理有限公司11002 | 代理人: | 王瑩,李相雨 |
| 地址: | 100102 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 算法 員工 離職 風險 預測 方法 裝置 | ||
技術領域
本發明實施例涉及數據分析技術領域,尤其涉及一種基于聚類算法的員工離職風險預測方法及裝置。
背景技術
在預測員工離職風險的方法上,傳統的方法主要分為兩種,一種是通過分析員工日常的行為習慣,如公司郵件內容,日常的上網內容和時間是否與工作相匹配,通過分析這些內容的變化來判斷是否發生離職風險。另一種是通過利用機器學習中分類器的方法,統計員工的日常行為習慣,KPI考核信息,滿意度,職位類別,薪水等,構建一種分類器(包含離職員工和正常續約的員工的訓練樣本)。用這個分類器對后續的員工表現進行評估。
傳統方案有如下方面的缺點:
第一,基于員工日常的行為習慣方法,統計公司的郵件內容,員工的上網內容等多維度分析是否會出現離職風險,會出現如下問題,首先統計的內容中包含文本,數值等多種類型的數據,針對這些數據,需要加入一定的規則或者條件(如判定閾值)來判定某個維度,如日常上網的行為是否超出風險控制范圍。還有就是當面對多維度時,經常會出現有些維度超出閾值,有些在合理范圍內,這時也需要加入一定的判定條件來整體確定員工是否會出現離職風險。加入過多的人為判定條件意味著需要大量的先驗知識,針對某一個具體的公司這些先驗知識很難確定精準,因此會導致模型的準確度受影響。
第二,利用機器學習分離器的方法,可以免去了設置判定條件的先驗知識,但是存在如下問。首先需要先有完整的訓練樣本,離線訓練好分類器后才能在新的測試集上做預測。這就帶來了一個時間上的滯后期。另一個問題就是通常情況下離職員工只占員工總數比例中很少的一部分,這樣就帶來了訓練樣本不均衡的問題,大量的訓練樣本都是非離職員工的,只有少量樣本是離職員工的樣本。
因此,如何提高預測的準確度,以及克服預測滯后性問題是現如今亟待解決的課題。
發明內容
針對現有技術存在的問題,本發明實施例提供一種基于聚類算法的員工離職風險預測方法及裝置。
第一方面,本發明實施例提供一種基于聚類算法的員工離職風險預測方法,包括:
獲取待測員工多個維度的預測數據,所述待測員工包括在職員工和已離職員工;
根據所述在職員工對應的第一員工數量和已離職員工的第二員工數量計算分組個數;
根據所述預測數據和所述分組個數,利用聚類算法對所述待測員工進行聚類分析,獲得每一分組對應的待測員工的信息;
根據每一分組對應的待測員工的信息預測所述待測員工中具有離職風險的員工。
第二方面,本發明實施例提供一種基于聚類算法的員工離職風險預測裝置,包括:
獲取模塊,用于獲取待測員工多個維度的預測數據,所述待測員工包括在職員工和已離職員工;
計算模塊,用于根據所述在職員工對應的第一員工數量和已離職員工的第二員工數量計算分組個數;
分析模塊,用于根據所述預測數據和所述分組個數,利用聚類算法對所述待測員工進行聚類分析,獲得每一分組對應的待測員工的信息;
預測模塊,用于根據每一分組對應的待測員工的信息預測所述待測員工中具有離職風險的員工。
第三方面,本發明實施例提供一種電子設備,包括:處理器、存儲器和總線,其中,
所述處理器和所述存儲器通過所述總線完成相互間的通信;
所述存儲器存儲有可被所述處理器執行的程序指令,所述處理器調用所述程序指令能夠執行第一方面的方法步驟。
第四方面,本發明實施例提供一種非暫態計算機可讀存儲介質,包括:
所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令使所述計算機執行第一方面的方法步驟。
本發明實施例提供的一種基于聚類算法的員工離職風險預測方法及裝置,通過根據所述在職員工對應的第一員工數量和已離職員工的第二員工數量計算分組個數,根據預測數據和分組格式獲得每一分組對應的待測員工的信息,最后根據待測員工的信息預測出具有離職風險的員工,從而提高了預測的準確度,以及克服預測滯后性問題。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例提供的一種基于聚類算法的員工離職風險預測方法流程示意圖;
圖2為本發明實施例提供的一種基于聚類算法的員工離職風險預測裝置結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京德塔精要信息技術有限公司,未經北京德塔精要信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710967297.2/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





