[發(fā)明專利]一種線上家裝場景下用戶流失預(yù)警模型的建模方法有效
| 申請?zhí)枺?/td> | 202010031987.9 | 申請日: | 2020-01-13 |
| 公開(公告)號: | CN111274791B | 公開(公告)日: | 2023-08-18 |
| 發(fā)明(設(shè)計(jì))人: | 陳旋;王沖;張平;付虹源 | 申請(專利權(quán))人: | 江蘇艾佳家居用品有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06N3/084;G06N3/04 |
| 代理公司: | 南京新慧恒誠知識產(chǎn)權(quán)代理有限公司 32424 | 代理人: | 鄧唯 |
| 地址: | 211100 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 線上 場景 用戶 流失 預(yù)警 模型 建模 方法 | ||
1.一種線上家裝場景下用戶流失預(yù)警模型的建模方法,其特征在于:具體包含如下步驟;
步驟1,確定停用詞表,停用詞包括助詞、連詞、介詞、地名、人名、人稱代詞、數(shù)字、標(biāo)點(diǎn)符號;
步驟2,標(biāo)注數(shù)據(jù):拉取所有交易成功的用戶和流失用戶的聊天記錄,并將所有交易成功的用戶的聊天記錄打上標(biāo)簽0,且作為正向數(shù)據(jù)樣本集合A,并將所有流失用戶的聊天記錄打上標(biāo)簽1,做為反向數(shù)據(jù)樣本集合B;
步驟3,計(jì)算并保存所有用戶發(fā)出的全部聊天文本中出現(xiàn)在關(guān)鍵詞庫W中的詞的idf值,具體計(jì)算公式為
步驟4,對正向數(shù)據(jù)樣本集合A與反向數(shù)據(jù)樣本集合B中每個(gè)用戶發(fā)出的全部聊天文本內(nèi)容進(jìn)行處理,先將文本分詞,再去除停用詞,得到該用戶聊天關(guān)鍵詞集合,進(jìn)而計(jì)算集合中每個(gè)詞的tf*idf值;
其中,idf為步驟3計(jì)算出的idf值,tf*idf值即為tf與idf的值的乘積;創(chuàng)建該聊天的文本向量,向量長度為N,向量的第m位對應(yīng)的是聊天關(guān)鍵詞庫W中編號為m的詞在該聊天中的tf*idf值,對于聊天中未曾出現(xiàn)的詞,其tf為0,且該位的值為0;記錄該向量對應(yīng)的標(biāo)簽,若該聊天屬于集合A,標(biāo)簽為0,否則為1;全部的聊天數(shù)據(jù)經(jīng)過處理后,得到一個(gè)每條數(shù)據(jù)是一個(gè)文本向量和一個(gè)標(biāo)簽的數(shù)據(jù)樣本集T;
步驟5,構(gòu)建淺層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);
在步驟5中,淺層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包含接入N維向量輸入的輸入層、若干矩陣組成的隱藏層以及以sigmoid函數(shù)做為輸出結(jié)果的輸出層;
所述淺層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程具體為:
步驟5.1,訓(xùn)練開始時(shí)以隨機(jī)值建立隱藏層矩陣將;
步驟5.2,將訓(xùn)練數(shù)據(jù)集中的每個(gè)詞向量輸入至輸入層后經(jīng)過與隱藏層的矩陣相乘后再由sigmoid函數(shù)將最終輸出值映射到(0,1)區(qū)間上做為輸出;
步驟5.3,通過交叉熵計(jì)算出模型的輸出結(jié)果與實(shí)際標(biāo)簽的誤差,通過梯度下降的方式將隱藏層矩陣優(yōu)化至誤差值最小;
步驟5.4,在數(shù)據(jù)樣本集T中使用K折交叉驗(yàn)證的方式進(jìn)行迭代訓(xùn)練,直至模型在驗(yàn)證集上的準(zhǔn)確率與誤差趨與穩(wěn)定。
2.根據(jù)權(quán)利要求1所述的一種線上家裝場景下用戶流失預(yù)警模型的建模方法,其特征在于:所述步驟1具體如下:在所有用戶發(fā)出的全部聊天文本中出現(xiàn)的停用詞以外的動(dòng)詞、名詞、形容詞、副詞中選取出現(xiàn)頻率最高的前n個(gè)詞做為聊天關(guān)鍵詞庫W,并為W中的每一個(gè)詞創(chuàng)建一個(gè)取值范圍在[1,n]的編號,每個(gè)詞的編號是唯一的,與其它詞不重復(fù)的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇艾佳家居用品有限公司,未經(jīng)江蘇艾佳家居用品有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010031987.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 電視場景切換的方法及電視
- 視頻場景控制系統(tǒng)及方法
- 場景開關(guān)及其場景開關(guān)構(gòu)件和場景圖標(biāo)卡組件
- 場景聯(lián)動(dòng)方法及場景聯(lián)動(dòng)系統(tǒng)
- 一種視頻場景分類方法、裝置、移動(dòng)終端及存儲介質(zhì)
- 一種Unity3D引擎的場景切換方法和系統(tǒng)
- 一種自動(dòng)駕駛場景分類識別系統(tǒng)及方法
- 一種虛擬場景生成方法、裝置、設(shè)備和存儲介質(zhì)
- 一種汽車圖像場景庫數(shù)據(jù)復(fù)雜度度量方法
- 場景識別方法、裝置、設(shè)備及存儲介質(zhì)





