[發(fā)明專(zhuān)利]一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)電信業(yè)用戶(hù)攜號(hào)轉(zhuǎn)出的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011178646.0 | 申請(qǐng)日: | 2020-10-29 |
| 公開(kāi)(公告)號(hào): | CN112153636A | 公開(kāi)(公告)日: | 2020-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 吳勇;嚴(yán)偉強(qiáng);鐘宏澤;王凱;李紡;梁建斌;陳一蕾 | 申請(qǐng)(專(zhuān)利權(quán))人: | 浙江鴻程計(jì)算機(jī)系統(tǒng)有限公司 |
| 主分類(lèi)號(hào): | H04W8/28 | 分類(lèi)號(hào): | H04W8/28;G06N20/00 |
| 代理公司: | 杭州之江專(zhuān)利事務(wù)所(普通合伙) 33216 | 代理人: | 張慧英 |
| 地址: | 310023 浙江省*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機(jī)器 學(xué)習(xí) 預(yù)測(cè) 電信業(yè) 用戶(hù) 轉(zhuǎn)出 方法 | ||
本發(fā)明涉及電信技術(shù)領(lǐng)域,尤其涉及一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)電信業(yè)用戶(hù)攜號(hào)轉(zhuǎn)出的方法,包括以下步驟:1)采集特征變量數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理保存到數(shù)據(jù)庫(kù)中,在數(shù)據(jù)庫(kù)中進(jìn)行樣本采樣,將正樣本和負(fù)樣本的比例控制在1:10;2)樣本隨機(jī)分為訓(xùn)練集和測(cè)試集;3)選擇XGBoost算法為基礎(chǔ)構(gòu)建預(yù)測(cè)模型,輸入訓(xùn)練集訓(xùn)練預(yù)測(cè)模型,獲得預(yù)測(cè)概率值和特征的重要程度;4)利用訓(xùn)練完成的模型對(duì)測(cè)試集進(jìn)行數(shù)據(jù)預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果對(duì)預(yù)測(cè)模型進(jìn)行評(píng)估,若評(píng)估結(jié)果低于閾值,對(duì)預(yù)測(cè)模型進(jìn)行優(yōu)化迭代。本發(fā)明的有益效果在于:提高預(yù)測(cè)效率,做到提前預(yù)警及時(shí)維系,預(yù)測(cè)模型能夠動(dòng)態(tài)進(jìn)行優(yōu)化迭代。
技術(shù)領(lǐng)域
本發(fā)明涉及電信技術(shù)領(lǐng)域,尤其涉及一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)電信業(yè)用戶(hù)攜號(hào)轉(zhuǎn)出的方法。
背景技術(shù)
應(yīng)工信部的要求,攜號(hào)轉(zhuǎn)網(wǎng)業(yè)務(wù)在2019年11月全面實(shí)施,主要內(nèi)容是用戶(hù)可根據(jù)自己的意愿選擇合適的電信運(yùn)營(yíng)商,同時(shí)在這個(gè)過(guò)程中,原來(lái)的號(hào)碼可以保留,實(shí)現(xiàn)移機(jī)不改號(hào)。
攜號(hào)轉(zhuǎn)網(wǎng)對(duì)于運(yùn)營(yíng)商來(lái)說(shuō),實(shí)際分為兩部分:攜號(hào)轉(zhuǎn)出和攜號(hào)轉(zhuǎn)入。攜號(hào)轉(zhuǎn)出是指用戶(hù)攜帶原來(lái)號(hào)碼從本網(wǎng)運(yùn)營(yíng)商轉(zhuǎn)出到他網(wǎng)運(yùn)營(yíng)商,可以看作高風(fēng)險(xiǎn)用戶(hù)存在離網(wǎng)的一種情況。攜號(hào)轉(zhuǎn)入則相反。
客戶(hù)資源是電信運(yùn)營(yíng)企業(yè)的核心競(jìng)爭(zhēng)力,如何減少客戶(hù)流失,降低客戶(hù)攜號(hào)轉(zhuǎn)出概率,減少由于客戶(hù)攜號(hào)轉(zhuǎn)出造成的經(jīng)濟(jì)損失成為了電信運(yùn)營(yíng)企業(yè)談?wù)摰闹饕?huà)題。電信企業(yè)積極利用前沿技術(shù)和資金,使企業(yè)向智能化、綜合化和個(gè)性化發(fā)展,提高競(jìng)爭(zhēng)力能力,以最大化自己的市場(chǎng)份額和利潤(rùn)。本方法為解決由于用戶(hù)攜號(hào)轉(zhuǎn)出導(dǎo)致市場(chǎng)份額減少、收入降低的問(wèn)題,同時(shí)目標(biāo)是提高挽留成功率、降低攜號(hào)轉(zhuǎn)出率、減少由于用戶(hù)攜號(hào)轉(zhuǎn)出帶來(lái)的收入損失。
在攜號(hào)轉(zhuǎn)網(wǎng)開(kāi)展以前,由于缺少正向樣本,即實(shí)際攜號(hào)轉(zhuǎn)出的用戶(hù),建立起的模型大多是是基于傳統(tǒng)的數(shù)據(jù)挖掘方法。多為非機(jī)器學(xué)習(xí)模型,例如規(guī)則經(jīng)驗(yàn)?zāi)P头治龇椒ǎ瑢?zhuān)家打分法。通過(guò)業(yè)務(wù)側(cè)制定的幾大轉(zhuǎn)網(wǎng)場(chǎng)景,統(tǒng)計(jì)處理,分析歸納,進(jìn)而劃分不同的轉(zhuǎn)網(wǎng)概率。這種方法存在的問(wèn)題是容易以偏概全,存在著諸多不確定的因素,因此轉(zhuǎn)網(wǎng)用戶(hù)預(yù)測(cè)準(zhǔn)確率不高,且較難做到用戶(hù)攜號(hào)轉(zhuǎn)出的提前預(yù)警。
發(fā)明內(nèi)容
本發(fā)明為克服上述的不足之處,目的在于提供一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)電信業(yè)用戶(hù)攜號(hào)轉(zhuǎn)出的方法,提前進(jìn)行精準(zhǔn)有效的預(yù)警。
本發(fā)明是通過(guò)以下脫敏方案達(dá)到上述目的:一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)電信業(yè)用戶(hù)攜號(hào)轉(zhuǎn)出的方法,包括以下步驟:
1)采集特征變量數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理保存到數(shù)據(jù)庫(kù)中,在數(shù)據(jù)庫(kù)中進(jìn)行樣本采樣,將正樣本和負(fù)樣本的比例控制在1:10;
2)樣本隨機(jī)分為訓(xùn)練集和測(cè)試集;
3)選擇XGBoost算法為基礎(chǔ)構(gòu)建預(yù)測(cè)模型,輸入訓(xùn)練集訓(xùn)練預(yù)測(cè)模型,獲得預(yù)測(cè)概率值和特征的重要程度;
4)利用訓(xùn)練完成的模型對(duì)測(cè)試集進(jìn)行數(shù)據(jù)預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果對(duì)預(yù)測(cè)模型進(jìn)行評(píng)估,若評(píng)估結(jié)果低于閾值,對(duì)預(yù)測(cè)模型進(jìn)行優(yōu)化迭代。
作為優(yōu)選,所述特征變量考慮現(xiàn)有存量用戶(hù)的各個(gè)維度特征,包括基本屬性、行為數(shù)據(jù)、套餐信息、消費(fèi)特征、終端信息、衍生變量。
作為優(yōu)選,所述預(yù)處理包括數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)清洗包括對(duì)錯(cuò)誤數(shù)值進(jìn)行修正,對(duì)缺失值填充,規(guī)范數(shù)據(jù)類(lèi)型。
作為優(yōu)選,對(duì)缺失值采用中位數(shù)或零值補(bǔ)充。
作為優(yōu)選,正樣本表示攜號(hào)轉(zhuǎn)出用戶(hù),負(fù)樣本表示非攜號(hào)轉(zhuǎn)出用戶(hù)。
作為優(yōu)選,采用五折交叉驗(yàn)證和網(wǎng)絡(luò)搜索獲得算法模型的最優(yōu)解。
作為優(yōu)選,采用F1值和AUC值進(jìn)行算法模型的評(píng)估。
作為優(yōu)選,閾值設(shè)置為0.5.
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于浙江鴻程計(jì)算機(jī)系統(tǒng)有限公司,未經(jīng)浙江鴻程計(jì)算機(jī)系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011178646.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
H04W 無(wú)線(xiàn)通信網(wǎng)絡(luò)
H04W8-00 網(wǎng)絡(luò)數(shù)據(jù)管理
H04W8-02 .移動(dòng)性數(shù)據(jù)處理,例如,在HLR[歸屬位置寄存器]或VLR[訪(fǎng)問(wèn)位置寄存器]上的注冊(cè)信息;在例如HLR,VLR或外部網(wǎng)絡(luò)之間的移動(dòng)性數(shù)據(jù)傳送
H04W8-18 .用戶(hù)或訂戶(hù)數(shù)據(jù)的處理,例如,訂閱的業(yè)務(wù),用戶(hù)優(yōu)先權(quán)或用戶(hù)簡(jiǎn)檔;用戶(hù)或訂戶(hù)數(shù)據(jù)的傳送
H04W8-22 .終端數(shù)據(jù)的處理或傳送,例如狀態(tài)或物理能力
H04W8-26 .用于移動(dòng)性支持的網(wǎng)絡(luò)尋址或編號(hào)
H04W8-30 .網(wǎng)絡(luò)數(shù)據(jù)恢復(fù)
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線(xiàn)上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類(lèi)預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





