[發(fā)明專利]識別存在家庭關(guān)系客戶的方法、裝置、設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 201811493732.3 | 申請日: | 2018-12-07 |
| 公開(公告)號: | CN109639478A | 公開(公告)日: | 2019-04-16 |
| 發(fā)明(設(shè)計(jì))人: | 張晟;劉亮;顧強(qiáng) | 申請(專利權(quán))人: | 中國移動通信集團(tuán)江蘇有限公司;中國移動通信集團(tuán)有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24;H04W24/02 |
| 代理公司: | 北京東方億思知識產(chǎn)權(quán)代理有限責(zé)任公司 11258 | 代理人: | 彭瓊 |
| 地址: | 210029 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 家庭關(guān)系 輸入變量 家庭用戶 訓(xùn)練樣本集 預(yù)設(shè) 客戶 預(yù)設(shè)時(shí)間段 獲取目標(biāo) 目標(biāo)位置 輸出規(guī)則 訓(xùn)練模型 用戶數(shù)據(jù) 準(zhǔn)確度 樣本集 建模 剔除 天數(shù) 通話 篩選 預(yù)測 | ||
1.一種識別存在家庭關(guān)系客戶的方法,包括:
獲取目標(biāo)位置的真實(shí)家庭用戶;
篩選所述目標(biāo)位置處預(yù)設(shè)時(shí)間段中閑時(shí)通話天數(shù)所占比例大于第一預(yù)設(shè)比例的交往圈用戶;
將所述真實(shí)家庭用戶和所述交往圈用戶進(jìn)行混合,得到基礎(chǔ)用戶;
從所述基礎(chǔ)用戶中選取第二預(yù)設(shè)比例的用戶作為訓(xùn)練樣本集用戶;
基于已知家庭關(guān)系樣本集用戶的多個(gè)輸入變量,從所述多個(gè)輸入變量中剔除與用于識別家庭關(guān)系無關(guān)的輸入變量,獲取多個(gè)重要輸入變量;
對所述訓(xùn)練樣本集用戶的多個(gè)重要輸入變量進(jìn)行建模,獲得存在家庭關(guān)系客戶的模型輸出規(guī)則;
根據(jù)所述模型輸出規(guī)則,識別存在家庭關(guān)系的客戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于已知家庭關(guān)系樣本集用戶的多個(gè)輸入變量,從所述多個(gè)輸入變量中剔除與用于識別家庭關(guān)系無關(guān)的輸入變量,獲取多個(gè)重要輸入變量,包括:
獲取所述基于已知家庭關(guān)系樣本集用戶的多個(gè)輸入變量;
基于所述多個(gè)輸入變量,通過數(shù)據(jù)審核和/或特征選擇,從所述多個(gè)輸入變量中獲取多個(gè)重要輸入變量。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述多個(gè)輸入變量包括如下項(xiàng)中的至少一種年齡差、夜間常駐小區(qū)是否重合、身份證是否相同、互相通話次數(shù)、交往圈重合數(shù)、是否同姓、是否屬于同一集團(tuán)網(wǎng)、互相通話天數(shù)、互相通話時(shí)長、忙時(shí)小區(qū)重合數(shù)、閑時(shí)小區(qū)重合數(shù)、使用相同國際移動設(shè)備識別碼IMEI次數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述多個(gè)重要輸入變量包括如下項(xiàng)中的至少一種年齡差、夜間常駐小區(qū)是否重合、身份證是否相同、互相通話次數(shù)、交往圈重合數(shù)、以及是否同姓。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述訓(xùn)練樣本集用戶的多個(gè)重要輸入變量進(jìn)行建模,包括:
利用決策樹算法C5.0,對所述訓(xùn)練樣本集用戶的多個(gè)重要輸入變量進(jìn)行建模,得到?jīng)Q策樹模型。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述訓(xùn)練樣本集用戶的多個(gè)重要輸入變量進(jìn)行建模,得到?jīng)Q策樹模型,包括:
基于所述訓(xùn)練樣本集用戶的多個(gè)重要輸入變量,得到所述多個(gè)重要輸入變量中每一個(gè)變量的信息增益率;
根據(jù)所述多個(gè)重要輸入變量中每一個(gè)變量的信息增益率,確定所述決策樹模型的最佳分組變量和分割點(diǎn);
根據(jù)所述最佳分組變量和分割點(diǎn),得到?jīng)Q策樹模型。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
對所述決策樹模型進(jìn)行建模分析,得到所述多個(gè)重要輸入變量中每一個(gè)變量所占的權(quán)重。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法還包括:
根據(jù)所述多個(gè)重要輸入變量中每一個(gè)變量所占的權(quán)重,獲得存在家庭關(guān)系客戶的模型輸出規(guī)則。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
將所述基礎(chǔ)用戶中除所述訓(xùn)練樣本集用戶之外的用戶作為驗(yàn)證樣本集用戶;
利用所述驗(yàn)證樣本集用戶,對所述模型輸出規(guī)則進(jìn)行評估。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述真實(shí)家庭用戶和所述交往圈用戶進(jìn)行混合,包括:
基于所述真實(shí)家庭用戶,以家庭為單位,將屬于同一家庭的用戶進(jìn)行兩兩組合,形成家庭關(guān)系對;
將所述家庭關(guān)系對和所述交往圈用戶混合,得到基礎(chǔ)用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國移動通信集團(tuán)江蘇有限公司;中國移動通信集團(tuán)有限公司,未經(jīng)中國移動通信集團(tuán)江蘇有限公司;中國移動通信集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811493732.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 移動終端、服務(wù)器及其信息獲取方法
- 一種基于交往頻度和交往指數(shù)的超大規(guī)模用戶的社交網(wǎng)絡(luò)分析及家庭關(guān)系識別算法
- 一種基于符號網(wǎng)絡(luò)的家庭親密度計(jì)算方法
- 家庭客戶保險(xiǎn)需求的數(shù)據(jù)處理方法及裝置
- 一種家庭關(guān)系識別方法和系統(tǒng)
- 一種用戶家庭關(guān)系的分析算法、服務(wù)器及網(wǎng)絡(luò)系統(tǒng)
- 識別存在家庭關(guān)系客戶的方法、裝置、設(shè)備及介質(zhì)
- 一種基于移動通信數(shù)據(jù)的用戶關(guān)系挖掘方法及系統(tǒng)
- 核心家庭關(guān)系補(bǔ)全方法、系統(tǒng)、存儲介質(zhì)及計(jì)算機(jī)設(shè)備
- 一種家庭關(guān)系挖掘方法和裝置
- 基于核局部線性表示的分類方法
- 一種分類器的構(gòu)建方法
- 翻譯模型訓(xùn)練的方法、語句翻譯的方法、設(shè)備及存儲介質(zhì)
- 一種識別惡意用戶的方法、裝置及存儲介質(zhì)
- 用于生成模型的方法和裝置
- 風(fēng)險(xiǎn)評測方法、模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)
- 訓(xùn)練樣本篩選方法、裝置、電子設(shè)備及存儲介質(zhì)
- 文本語料的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種圖像處理模型、機(jī)器學(xué)習(xí)模型的訓(xùn)練方法及裝置
- 訓(xùn)練樣本集生成方法、深度生成模型的訓(xùn)練方法和裝置





