[發明專利]一種基于平均共識算法的物聯網環境下分布式軟聚類方法有效
| 申請號: | 202010131908.1 | 申請日: | 2020-02-29 |
| 公開(公告)號: | CN111401412B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 趙生捷;余豪;史清江;張榮慶 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海科盛知識產權代理有限公司 31225 | 代理人: | 宣慧蘭 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 平均 共識 算法 聯網 環境 分布式 軟聚類 方法 | ||
本發明涉及一種基于平均共識算法的物聯網環境下分布式軟聚類方法,具體步驟如下:步驟S1:獲取目標物聯網節點所在的拓撲網絡,將分布式數據集、聚類數目、模糊系數和停止準則參數輸入至拓撲網絡;步驟S2:初始化分布式數據集的集合元素,計算出目標物聯網節點的初始聚類中心;步驟S3:計算分布式數據集到初始聚類中心的分配矩陣;步驟S4:根據分配矩陣,計算目標物聯網節點內的聚類中心,并通過平均共識算法獲得全局聚類中心;步驟S5:重復步驟S1?S4,迭代更新全局聚類中心,根據停止準則參數對當前全局聚類中心與上一輪的全局聚類中心進行判斷,輸出最終全局聚類中心。與現有技術相比,本發明具有能有效提高聚類結果的質量和算法的穩定性等優點。
技術領域
本發明涉及機器學習領域,尤其是涉及一種基于平均共識算法的物聯網環境下分布式軟聚類方法。
背景技術
作為互聯網的拓展,物聯網將機器和設備與服務連接,是當前最有前景的技術領域之一。由于物聯網中數據量的激增以及物聯網設備安全性的考慮,傳統的中心式存儲與計算平臺面臨挑戰。在諸多的應用場景如醫療健康、社交媒體等中,都有著獲取數據隱藏信息與結構的需求,而這些數據分散于分布式的物聯網節點中,對數據獲取增加了難度。在數據分析與挖掘的算法模型中,聚類算法是簡單有效的一類算法,而軟聚類算法如Fuzzy C-means能更有效地獲取到數據地豐富信息。
目前的研究中,將分布式聚類問題視為帶共識約束的聚類優化問題,并使用增廣拉格朗日算法求解,但這樣的方法的局限性在于:算法中有一些參數對輸入數據集和網絡結構較為敏感,因此需要一定的參數調節工作;另外,當數據集不平衡或數據特征過多時,該算法無法保證收斂。同時在基于多代理一致性理論的傳感器網絡分布式K-means算法和模糊C-means算法的研究中也運用到了軟聚類算法,但是該研究中聚類結果的局限性在于應用場景過于簡單,并且使用的初始化方法為K-Means++算法,該算法存在一定的概率隨機性,在某些情況下容易產生較差的聚類結果,即算法的穩定性不高。
發明內容
本發明的目的就是為了克服上述現有技術存在的軟聚類算法受數據集影響較大、穩定性不高的缺陷而提供一種基于平均共識算法的物聯網環境下分布式軟聚類方法。
本發明的目的可以通過以下技術方案來實現:
一種基于平均共識算法的物聯網環境下分布式軟聚類方法,具體步驟如下:
步驟S1:獲取目標物聯網節點所在的拓撲網絡,將分布式數據集、聚類數目、模糊系數和停止準則參數輸入至所述拓撲網絡;
步驟S2:初始化所述分布式數據集的集合元素,并通過分布式聚類中心初始化算法計算出所述目標物聯網節點的初始聚類中心;
步驟S3:計算所述分布式數據集到所述初始聚類中心的分配矩陣;
步驟S4:根據所述分配矩陣,計算所述目標物聯網節點內的聚類中心,并通過平均共識算法獲得所述拓撲網絡的全局聚類中心;
步驟S5:重復步驟S1-S4,迭代更新所述全局聚類中心,判斷當前所述全局聚類中心與上一輪迭代的全局聚類中心的差值是否小于所述停止準則參數,若是則輸出當前所述全局聚類中心,迭代停止,若否將繼續進行迭代。
所述拓撲網絡包括所述目標物聯網節點的網絡節點數和鄰居節點集合。
所述步驟S2中初始化分布式數據集的集合元素具體如下:
其中,為分布式數據集,為分布式數據集中第1個聚類集合,為分布式數據集中第k個聚類集合。
所述初始聚類中心的計算公式具體如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010131908.1/2.html,轉載請聲明來源鉆瓜專利網。





