[發(fā)明專利]融入簇存在強度的數(shù)據(jù)流聚類方法有效
| 申請?zhí)枺?/td> | 201410314647.1 | 申請日: | 2014-07-03 |
| 公開(公告)號: | CN104090950B | 公開(公告)日: | 2017-04-12 |
| 發(fā)明(設(shè)計)人: | 琚春華;鮑福光;肖亮;魏建良 | 申請(專利權(quán))人: | 浙江工商大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州裕陽專利事務(wù)所(普通合伙)33221 | 代理人: | 應(yīng)圣義 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 融入 存在 強度 數(shù)據(jù)流 方法 | ||
1.一種融入簇存在強度的數(shù)據(jù)流聚類方法,其特征在于,包括以下的具體步驟:預(yù)處理步驟(100):對特定用戶的用戶特征信息進行處理以形成用戶屬性數(shù)據(jù)庫,所述用戶特征信息是指包括用戶背景信息以及用戶行為信息的可以用人機交互界面或者人機交互裝置進行數(shù)據(jù)采集并可以轉(zhuǎn)化為可以用特定長度和格式的數(shù)據(jù)串進行表征的用戶屬性數(shù)據(jù),所述用戶屬性數(shù)據(jù)庫用于存放所述用戶屬性數(shù)據(jù);
用戶聚類步驟(200):將至少兩個用戶的用戶屬性數(shù)據(jù)集合形成用戶群屬性庫,其中,用于形成用戶群屬性庫的用戶屬性數(shù)據(jù)包括用戶不確定性數(shù)據(jù)流,所述用戶不確定性數(shù)據(jù)流由至少兩個元組組成,所述元組包括用戶屬性數(shù)據(jù)以及表征所述用戶屬性數(shù)據(jù)的出現(xiàn)的不確定性的存在概率,所述存在概率通過賦予所述用戶屬性數(shù)據(jù)以一個隨機變量得到,所述隨機變量是指在一定的給定區(qū)域上符合概率分布的隨機量,所述給定區(qū)域是指在一定的時間范圍內(nèi)用戶屬性數(shù)據(jù)的變化區(qū)域;
關(guān)聯(lián)規(guī)則步驟(300):依據(jù)用戶群屬性數(shù)據(jù)庫所包含的用戶屬性數(shù)據(jù)形成關(guān)聯(lián)規(guī)則,并將所述關(guān)聯(lián)規(guī)則存放于用戶行為規(guī)則庫,所述關(guān)聯(lián)規(guī)則是指用戶屬性數(shù)據(jù)的可以用初等函數(shù)進行表示的變化趨勢;
漂移檢測步驟(400):對不同時間段內(nèi)所產(chǎn)生的關(guān)聯(lián)規(guī)則進行檢測,生成最終的用戶行為規(guī)則,并將所生成的用戶行為規(guī)則作為數(shù)據(jù)流聚類方法。
2.根據(jù)權(quán)利要求1所述的融入簇存在強度的數(shù)據(jù)流聚類方法,其特征在于,還包括以下具體步驟:
雙區(qū)聚類步驟(500):組建簇,所述簇由至少兩個元組構(gòu)成;創(chuàng)建微簇,所述微簇至少包括二階矩CF2、一階矩CF1、存在概率APC、微簇創(chuàng)建時間tS、微簇最后更新時間te、樣本容量n、簇編號CID、分區(qū)編號MID,其中,所述微簇與簇一一對應(yīng),所述二階矩CF2是指簇的連續(xù)變量的二階矩,所述一階矩CF1是指簇的連續(xù)變量的一階矩,所述分區(qū)編號MID是指微簇所在分區(qū)的編號;進行雙區(qū)聚類,所述雙區(qū)聚類是指將簇劃分為兩類:主緩沖區(qū)Bufc簇以及副緩沖區(qū)Bufo簇,所述主緩沖區(qū)Bufc簇是指當(dāng)對一個新元組進行聚類時,首先在主緩沖區(qū)Bufc中進行聚類得到的簇,所述主緩沖區(qū)Bufc簇是指當(dāng)主緩沖區(qū)Bufc中的簇不適合新元組時,則在副緩沖區(qū)Bufo中進行聚類得到的簇,所述不適合是指新元組的加入會令被加入的簇的存在強度發(fā)生超出預(yù)設(shè)閾值的改變。
3.根據(jù)權(quán)利要求2所述的融入簇存在強度的數(shù)據(jù)流聚類方法,其特征在于,所述雙區(qū)聚類步驟(500)還包括,當(dāng)副緩沖區(qū)Bufo中的簇不適合新元組時,將該新元組思維全局離散點,做丟棄處理。
4.根據(jù)權(quán)利要求2所述的融入簇存在強度的數(shù)據(jù)流聚類方法,其特征在于,所述簇的存在強度的改變是指簇發(fā)生由強簇變?yōu)槿醮鼗蛘哌^渡簇,所述強簇是指對于預(yù)設(shè)值α,0<α<1,所述簇的存在概率APC≥α的簇,所述弱簇是指滿足存在概率APC<β,且滿足β<min的簇,所述過渡簇是指介于強簇和弱簇之間的簇。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工商大學(xué),未經(jīng)浙江工商大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410314647.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 編碼裝置,編碼方法,程序和記錄媒體
- 網(wǎng)絡(luò)數(shù)據(jù)流識別系統(tǒng)及方法
- 一種數(shù)據(jù)流調(diào)度的方法、設(shè)備和系統(tǒng)
- 一種確定待清洗數(shù)據(jù)流的方法及裝置
- 用于分析儀器化軟件的數(shù)據(jù)流處理語言
- 用于數(shù)據(jù)流系統(tǒng)的數(shù)據(jù)流處理方法及裝置
- 數(shù)據(jù)流調(diào)度系統(tǒng)以及數(shù)據(jù)流調(diào)度方法
- 采用向量處理的同時分割
- 汽車數(shù)據(jù)流的監(jiān)控方法、系統(tǒng)及可讀存儲介質(zhì)
- 一種數(shù)據(jù)流類型識別模型更新方法及相關(guān)設(shè)備





