[發(fā)明專利]一種用戶等級(jí)自動(dòng)劃分方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201610537520.5 | 申請日: | 2016-07-08 |
| 公開(公告)號(hào): | CN106202388B | 公開(公告)日: | 2017-12-08 |
| 發(fā)明(設(shè)計(jì))人: | 龔燦 | 申請(專利權(quán))人: | 武漢斗魚網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 武漢智權(quán)專利代理事務(wù)所(特殊普通合伙)42225 | 代理人: | 沈林華 |
| 地址: | 430000 湖北省武漢市東湖開*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用戶 等級(jí) 自動(dòng) 劃分 方法 系統(tǒng) | ||
1.一種用戶等級(jí)自動(dòng)劃分方法,其特征在于,該方法包括以下步驟:
步驟S1、選擇樣本數(shù)據(jù):選取指定時(shí)間段內(nèi)的用戶行為數(shù)據(jù)作為原始樣本數(shù)據(jù),轉(zhuǎn)入步驟S2;
步驟S2、選擇用戶特征:在用戶行為數(shù)據(jù)中選取至少一種用戶特征作為計(jì)算距離的維度,轉(zhuǎn)入步驟S3;
步驟S3、確定分類的個(gè)數(shù)K值:根據(jù)用戶被分成幾個(gè)類別等級(jí),確定分類的個(gè)數(shù)K,K為正整數(shù),轉(zhuǎn)入步驟S4;
步驟S4、確定初始類心:隨機(jī)在原始樣本數(shù)據(jù)中挑選K個(gè)用戶作為初始類心,轉(zhuǎn)入步驟S5;
步驟S5、歸類劃分:根據(jù)步驟S2中選取的維度,測量原始樣本數(shù)據(jù)中剩余的每個(gè)用戶到當(dāng)前各個(gè)類心的距離D,距離D的計(jì)算公式為:
D=(xj-μi)2
其中,xj為第j個(gè)用戶特征,j為正整數(shù),μi為第i個(gè)類的類心,i為1~K的正整數(shù);將所述剩余的每個(gè)用戶歸類到距離最近的一個(gè)類中,完成K個(gè)類的劃分,轉(zhuǎn)入步驟S6;
步驟S6、計(jì)算新的類心:在當(dāng)前已經(jīng)劃分好的K個(gè)類中,重新計(jì)算各個(gè)類的類心,轉(zhuǎn)入步驟S7;
步驟S7、重復(fù)迭代步驟S5、S6,直至新的類心與重新計(jì)算前的類心相等或者變化量小于指定閾值時(shí),停止迭代運(yùn)算,則當(dāng)前所劃分的K個(gè)分類即為所需劃分的用戶等級(jí)分類;
其中,步驟S6具體包括以下操作:
步驟S601:針對當(dāng)前K類中每一類下屬的每一個(gè)用戶,分別計(jì)算該用戶到本類其他用戶的距離和V,距離和計(jì)算公式為:
其中,xj為第j個(gè)用戶特征,j為正整數(shù),μi為第i個(gè)類的類心,i為1~K的正整數(shù),Si表示用戶特征的集合,轉(zhuǎn)入步驟S602;
步驟S602:為K類中的每一類選取距離和最小的用戶作為該類的新的類心。
2.如權(quán)利要求1所述的用戶等級(jí)自動(dòng)劃分方法,其特征在于:步驟S2中所述用戶特征包括用戶觀看時(shí)長、用戶觀看次數(shù)、用戶發(fā)送彈幕數(shù)、用戶發(fā)送免費(fèi)道具數(shù)、用戶在線領(lǐng)取免費(fèi)道具數(shù)、用戶發(fā)送付費(fèi)道具數(shù)、用戶關(guān)注房間數(shù)、用戶關(guān)注分區(qū)數(shù)。
3.如權(quán)利要求1所述的用戶等級(jí)自動(dòng)劃分方法,其特征在于,在步驟S2之后還包括歸一化特征值的操作:
對每個(gè)選取的用戶特征進(jìn)行特征值的歸一化計(jì)算,計(jì)算公式為:
Y=(X-MinValue(X))/(MaxValue(X)-MinValue(X)),
其中,Y為歸一化后的特征值,X為某個(gè)用戶特征對應(yīng)的一個(gè)用戶特征值,MinValue(X)為該用戶特征中最小的用戶特征值,MaxValue(X)為該用戶特征中最大的用戶特征值,歸一化之后的用戶特征值都集中在(0,1]之間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢斗魚網(wǎng)絡(luò)科技有限公司,未經(jīng)武漢斗魚網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610537520.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種搜索結(jié)果展示方法和裝置
- 下一篇:一種對象信息的處理方法及裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 用于顯示液晶顯示器件的等級(jí)的自動(dòng)設(shè)備以及操作方法
- 分級(jí)數(shù)據(jù)庫管理的系統(tǒng)、方法和程序
- 用于顯示工廠的批量處理數(shù)據(jù)的方法和設(shè)備
- 通信裝置和通信方法
- 信賴等級(jí)激活
- 一種報(bào)警等級(jí)的評(píng)估方法及系統(tǒng)
- 圖像降噪方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 環(huán)境數(shù)據(jù)調(diào)整方法及裝置、電子設(shè)備及介質(zhì)
- 空管臺(tái)站的等級(jí)確定方法、裝置及存儲(chǔ)介質(zhì)
- 互聯(lián)網(wǎng)銀行自助注冊系統(tǒng)及方法





