[發明專利]狀態預測方法和裝置有效
| 申請號: | 201711349699.2 | 申請日: | 2017-12-15 |
| 公開(公告)號: | CN107832581B | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 胡瑞華 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06N20/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 狀態 預測 方法 裝置 | ||
本發明提出一種狀態預測方法和裝置,其中,方法包括:對目標用戶進行采樣,根據識別出的采樣時刻已流失和未流失用戶的賬戶信息,分別生成負樣本、正樣本和驗證樣本,根據正、負樣本,對用于預測在采樣時刻之后用戶流失狀態的決策樹模型進行訓練,將驗證樣本輸入訓練后的決策樹模型,以得到預測流失狀態,若預測流失狀態與實際流失狀態計算得到的準召率不小于閾值,確定決策樹模型訓練完成,并進行用戶流失狀態的預測。通過采樣目標用戶生成的訓練樣本,對決策樹模型進行訓練,根據訓練完成的決策樹模型對用戶流失狀態預測,解決了現有技術中,通過人工經驗或者制定規則進行用戶流失狀態預測,導致識別效率較低,且不易復用的技術問題。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種狀態預測方法和裝置。
背景技術
隨著互聯網的發展,很多互聯網公司都有大量的付費客戶,且客戶群體是逐年快遞增長的,對客戶進行維護的售后服務就尤為重要,而目前的售后服務有兩個特點,一是客戶問題繁多,復雜,凌亂,客服離職率高,面對這種現狀,大部分客服不知道該做什么,怎么做;二是客服資源有限,單個客服維護賬戶數就有數百,客服的工作強度大,工作難度大,且服務質量難以保證。
面對這種情況,篩選出存在問題、需要維護的賬戶,并下發給客戶對應的工作任務,顯得尤為重要,但是,相關技術中,采用的是專門的團隊每天對客戶全體進行手工篩選,或者是制定相關的客戶篩選規則,篩選出需要維護的客戶,并通過下發系統下發給對應的客服,但是這種方式需要依賴有經驗的特定人群,且不一定能準確代表業務需求,或出現漏篩選、錯篩選的可能,導致識別效率較低的問題。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的第一個目的在于提出一種狀態預測方法,通過對目標用戶采樣生成的正樣本、驗證樣本和負樣本,對決策樹模型進行訓練,根據訓練完成的決策樹模型對采樣時刻之后的用戶流失狀態預測,解決了現有技術中,通過人工經驗或者制定規則進行用戶流失狀態預測,導致識別效率較低,且不易復用的技術問題。
本發明的第二個目的在于提出一種狀態預測裝置。
本發明的第三個目的在于提出一種計算機設備。
本發明的第四個目的在于提出一種非臨時性計算機可讀存儲介質。
本發明的第五個目的在于提出一種計算機程序產品。
為達上述目的,本發明第一方面實施例提出了一種狀態預測方法,包括:
對目標用戶進行采樣;
從采樣得到的目標用戶中,識別出在采樣時刻已流失用戶和未流失用戶;其中,已流失用戶為采樣時刻之前的目標時長內未執行所述目標行為的用戶,未流失用戶為采樣時刻之前的目標時長內執行過所述目標行為的用戶;
根據在采樣時刻已流失用戶的賬戶信息,生成負樣本,并根據在采樣時刻未流失用戶的賬戶信息,生成正樣本和驗證樣本;
根據所述負樣本和所述正樣本,對用于預測在所述采樣時刻之后用戶流失狀態的決策樹模型進行訓練;
將所述驗證樣本輸入經過訓練的決策樹模型,以得到預測流失狀態;
若根據所述驗證樣本的預測流失狀態與實際流失狀態計算得到的準召率不小于閾值,確定所述決策樹模型訓練完成;其中,實際流失狀態,是根據所述采樣時刻之后的所述目標時長內用戶是否執行過所述目標行為確定的;
根據訓練完成的所述決策樹模型,進行用戶流失狀態的預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711349699.2/2.html,轉載請聲明來源鉆瓜專利網。





