[發(fā)明專利]一種潛在客戶數(shù)據(jù)處理方法和裝置在審
| 申請?zhí)枺?/td> | 201911070074.1 | 申請日: | 2019-11-05 |
| 公開(公告)號: | CN110895564A | 公開(公告)日: | 2020-03-20 |
| 發(fā)明(設(shè)計)人: | 韓沙日拉 | 申請(專利權(quán))人: | 泰康保險集團股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06Q40/08 |
| 代理公司: | 中原信達知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 李陽;郭晗 |
| 地址: | 100031 北京市西*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 潛在 客戶 數(shù)據(jù)處理 方法 裝置 | ||
本發(fā)明公開了一種潛在客戶數(shù)據(jù)處理方法和裝置,涉及計算機技術(shù)領(lǐng)域。該方法的一具體實施方式包括:提取待處理用戶的多個維度的特征,將提取的所述多個維度的特征輸入構(gòu)建的第一決策樹分類器,以確定所述待處理用戶在所述第一決策樹分類器中所屬的最后一級分類,所述第一決策樹分類器的每個最后一級分類分別對應(yīng)一組用戶樣本;在所述待處理用戶所屬的最后一級分類對應(yīng)的一組用戶樣本中,至少一個用戶樣本標(biāo)注了不存在購買保險記錄的情況下,將所述待處理用戶標(biāo)記為可能購買保險的潛在客戶。該實施方式能夠提高處理結(jié)果的準(zhǔn)確性和穩(wěn)定性,簡化了處理流程和算法,較大程度上調(diào)整特征值為最優(yōu),克服時錯誤增加較快缺陷,提升拓客效率。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種潛在客戶數(shù)據(jù)處理方法和裝置。
背景技術(shù)
隨著保險行業(yè)的快速發(fā)展,客戶群越來越體現(xiàn)出多樣化的特點,對用戶數(shù)據(jù)分析以確定潛在客戶的需求越來越大。另一方面,基于決策樹等的分類技術(shù)作為一項底層基礎(chǔ)算法,目前已經(jīng)被廣泛應(yīng)用在機器學(xué)習(xí)、人工智能、金融領(lǐng)域、保險領(lǐng)域、遙感領(lǐng)域、天氣預(yù)測等領(lǐng)域。決策樹算法包括ID3、C4.5等算法,現(xiàn)有的基于這些算法對潛在客戶數(shù)據(jù)處理是基于單一特征來進行分類,處理結(jié)果的準(zhǔn)確性和穩(wěn)定性均不高,且需要很多預(yù)處理的工作要求,以及存在特征值較多的屬性不是最優(yōu)、類別太多時錯誤增加得比較快等缺陷。此外,現(xiàn)有的基于獲取到的潛在客戶種類繁多的海量數(shù)據(jù)分析處理方案無法對得出的潛在客戶進行歸類,對于保險領(lǐng)域而言,不同的潛在客戶的開拓價值往往是不同的,而現(xiàn)有潛在客戶數(shù)據(jù)分析處理方案只能將潛在客戶歸為一類,使得拓客(開拓客戶)的效率大為降低。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:
現(xiàn)有對潛在客戶數(shù)據(jù)處理方案,其處理結(jié)果的準(zhǔn)確性和穩(wěn)定性均不高,且需要很多預(yù)處理的工作要求,以及存在特征值較多的屬性不是最優(yōu)、類別太多時錯誤增加得比較快等缺陷,此外,現(xiàn)有方案無法對得出的潛在客戶進行歸類,降低了拓客效率。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供一種潛在客戶數(shù)據(jù)處理方法和裝置,能夠提高處理結(jié)果的準(zhǔn)確性和穩(wěn)定性,簡化了處理流程和算法,較大程度上調(diào)整特征值為最優(yōu),并克服類別太多時錯誤增加得比較快等缺陷,使得快速準(zhǔn)確地分析并標(biāo)記出可能購買保險的潛在客戶,此外,還可以自動對得到的潛在客戶歸類,提升了后續(xù)的拓客效率。
為實現(xiàn)上述目的,根據(jù)本發(fā)明實施例的一個方面,提供了一種潛在客戶數(shù)據(jù)處理方法。
一種潛在客戶數(shù)據(jù)處理方法,包括:提取待處理用戶的多個維度的特征,將提取的所述多個維度的特征輸入構(gòu)建的第一決策樹分類器,以確定所述待處理用戶在所述第一決策樹分類器中所屬的最后一級分類,所述第一決策樹分類器的每個最后一級分類分別對應(yīng)一組用戶樣本;在所述待處理用戶所屬的最后一級分類對應(yīng)的一組用戶樣本中,至少一個用戶樣本標(biāo)注了不存在購買保險記錄的情況下,將所述待處理用戶標(biāo)記為可能購買保險的潛在客戶。
可選地,使用所述用戶樣本構(gòu)建所述第一決策樹分類器,其中,每一用戶樣本有所述多個維度的特征以及標(biāo)注的是否存在購買保險記錄的信息,構(gòu)建所述第一決策樹分類器時,每級分支基于從所述多個維度中選出的兩個維度特征對所述用戶樣本分類,直到最后剩余維度的數(shù)量不超過2時,基于所述剩余維度的特征對所述用戶樣本進行最后一級分類。
可選地,使用所述用戶樣本構(gòu)建所述第一決策樹分類器的步驟,包括:使用多個樣本數(shù)據(jù)集的用戶樣本分別構(gòu)建多個決策樹分類器;從所述多個決策樹分類器中選出最優(yōu)決策樹分類器,作為所述第一決策樹分類器。
可選地,從所述多個決策樹分類器中選出最優(yōu)決策樹分類器,包括:根據(jù)每個決策樹分類器中最后一級分類對應(yīng)的標(biāo)注了不存在購買保險記錄的用戶樣本數(shù)量,選出所述用戶樣本數(shù)量最大的一個決策樹分類器,作為所述最優(yōu)決策樹分類器。
可選地,所述多個決策樹分類器的同級分支之間的維度相同或不同。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于泰康保險集團股份有限公司,未經(jīng)泰康保險集團股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911070074.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種圖像信息提取方法和裝置
- 下一篇:一種故障檢測方法和裝置
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





