[發(fā)明專利]一種高斯混合模型樹及其遞增聚類方法有效
| 申請?zhí)枺?/td> | 201410035056.0 | 申請日: | 2014-01-24 |
| 公開(公告)號: | CN103823843B | 公開(公告)日: | 2017-02-22 |
| 發(fā)明(設計)人: | 劉峽壁;伍藝;萬玉釵 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 混合 模型 及其 遞增 方法 | ||
1.一種高斯混合模型樹,其特征在于:高斯混合模型樹的葉子節(jié)點對應著單個高斯成分,反映了該高斯混合模型樹中最稠密的數(shù)據(jù)分布,分布的稠密程度由單高斯成分的最大方差控制;數(shù)據(jù)稠密程度自下而上變得稀疏,樹的高層節(jié)點由低層的節(jié)點組合而成,即高斯成分的組合,高層節(jié)點對應更稀疏的數(shù)據(jù)分布,根節(jié)點對應著整個數(shù)據(jù)集的高斯分布,也是該高斯混合模型樹中最稀疏的數(shù)據(jù)分布;該高斯混合模型樹由上述的葉子節(jié)點和高層節(jié)點構成,反映了數(shù)據(jù)聚類、子聚類、整個數(shù)據(jù)集的關系。
2.根據(jù)權利要求1所述的一種高斯混合模型樹,其特征在于:高層節(jié)點對應高斯混合模型;樹的構建方式是自底向上的。
3.一種高斯混合模型樹的遞增聚類方法,其特征在于,包括四個技術環(huán)節(jié):數(shù)據(jù)插入、更新聚類樹、數(shù)據(jù)刪除和聚類結果確定;這四個技術環(huán)節(jié)的關系為:對于每一個新數(shù)據(jù),都插入到現(xiàn)有的高斯混合模型樹,再根據(jù)插入的結果更新聚類樹;隨著新數(shù)據(jù)的插入,檢查已經插入到聚類樹的數(shù)據(jù)是否需要刪除,如果需要刪除,則刪除數(shù)據(jù);當所有數(shù)據(jù)讀取完成之后,確定聚類結果;具體實現(xiàn)步驟如下:
技術環(huán)節(jié)1、數(shù)據(jù)插入:將每一個新數(shù)據(jù)插入至高斯混合模型樹的葉子層,有可能插入到現(xiàn)有的葉子節(jié)點,也有可能生成新的葉子節(jié)點;
技術環(huán)節(jié)2、更新聚類樹:當新的數(shù)據(jù)被插入到最恰當?shù)娜~子節(jié)點后,當前的高斯混合模型樹的結構和參數(shù)會隨之更新,更新的節(jié)點包括插入新數(shù)據(jù)的葉子節(jié)點和與之相關的高層節(jié)點;聚類樹結構的變化主要體現(xiàn)在非葉子節(jié)點是否需要分裂,參數(shù)的變化包括葉子節(jié)點中單個高斯成分的參數(shù)、非葉子節(jié)點中高斯混合模型的參數(shù);
技術環(huán)節(jié)3、在聚類過程中,允許用戶刪除之前已經插入到高斯混合模型樹中的數(shù)據(jù),首先定位到保存了要刪除數(shù)據(jù)的葉子節(jié)點,刪除該數(shù)據(jù),判斷葉子節(jié)點是否需要分裂,再如技術環(huán)節(jié)2所述更新聚類樹;
技術環(huán)節(jié)4、聚類結果確定:本發(fā)明提出的方法可以根據(jù)用戶對聚類結果的稠密程度的需求不同,確定不同的層作為聚類結果,在用戶沒有指定特殊需求的情況下,選擇根節(jié)點的孩子節(jié)點這一層作為聚類結果返回給用戶。
4.根據(jù)權利要求3所述的一種高斯混合模型樹的遞增聚類方法,其特征在于,技術環(huán)節(jié)1中判斷是否生成新葉子節(jié)點的標準為:計算新插入的數(shù)據(jù)與葉子節(jié)點的均值的歐氏距離。
5.根據(jù)權利要求3所述的一種高斯混合模型樹的遞增聚類方法,其特征在于,更新聚類樹結構時,通過計算非葉子節(jié)點對應的子節(jié)點的連通圖個數(shù)來判斷是否要分裂以及分裂的個數(shù)。
6.根據(jù)權利要求3所述的一種高斯混合模型樹的遞增聚類方法,其特征在于,刪除葉子節(jié)點中的數(shù)據(jù)之后要判斷葉子節(jié)點是否需要分裂,判斷的標準是計算該葉子節(jié)點對應的方差是否大于預先設置的閾值;如果需要分裂,分裂的個數(shù)通過計算該葉子節(jié)點對應的數(shù)據(jù)的連通圖個數(shù)決定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410035056.0/1.html,轉載請聲明來源鉆瓜專利網。





