[發明專利]對數據進行聚類的方法、裝置、電子設備及存儲介質在審
| 申請號: | 202210163273.2 | 申請日: | 2022-02-22 |
| 公開(公告)號: | CN114548276A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 潘啟灝;張鼎;黃飛;徐紅艷;李永超 | 申請(專利權)人: | OPPO廣東移動通信有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 馮瑤 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 進行 方法 裝置 電子設備 存儲 介質 | ||
本申請涉及一種對數據進行聚類的方法、裝置、電子設備及存儲介質,屬于數據處理技術領域。該方法包括:獲取目標聚類事件的多個待聚類數據;通過多種聚類算法分別對多個待聚類數據進行聚類,得到多個第一聚類結果;對于每個第一聚類結果,確定第一聚類結果下多個待聚類數據的隸屬度矩陣,隸屬度矩陣表示在第一聚類結果下每個待聚類數據相對于第一聚類結果的每個聚簇的隸屬度;基于多個隸屬度矩陣,對多個待聚類數據進行聚類,得到目標聚類事件的第二聚類結果,以確定多個待聚類數據的類別。這樣基于融合了待聚類數據的多種劃分信息的隸屬度矩陣對多個待聚類數據再次進行聚類,保留了更多的劃分信息,避免了單個聚類算法對數據結構不適應的問題。
技術領域
本申請實施例涉及數據處理技術領域,特別涉及一種對數據進行聚類的方法、裝置、電子設備及存儲介質。
背景技術
隨著數據處理技術的發展,數據收集手段逐漸成熟,收集到的數據大量增加。隨著收集的數據大量增加,從收集到的數據中提取有用的信息來解釋這些數據成為了最困難的問題。而對數據進行聚類能夠揭示數據和特征之間的內部關系,在提取信息的過程中發揮著重要作用。
相關技術中,已經開發了許多聚類算法來處理不同的問題。例如,劃分式聚類、密度聚類或層次聚類等。這些聚類算法使用不同的距離或相似性作為度量參數,使用不同的目標函數進行衡量。不同的聚類算法對于同一數據集會產生不同的聚類結果,且對于有著不同數據結構的數據集往往表現出不同的性能。因此,在對數據進行聚類時,需要選擇對應的聚類方法進行聚類。
上述相關技術中,一旦聚類算法選定,初始化參數對聚類結果有重大影響。因此,在聚類過程中選擇合適的聚類算法以及各種參數是困難的。因此,亟需一種新的聚類方法。
發明內容
本申請實施例提供了一種對數據進行聚類的方法、裝置、電子設備及存儲介質,避免了單個聚類算法對數據結構不適應的問題。所述技術方案如下:
一方面,提供了一種對數據進行聚類的方法,所述方法包括:
獲取目標聚類事件的多個待聚類數據;
通過多種聚類算法分別對所述多個待聚類數據進行聚類,得到多個第一聚類結果;
對于每個第一聚類結果,確定所述第一聚類結果下所述多個待聚類數據的隸屬度矩陣,所述隸屬度矩陣表示在所述第一聚類結果下每個待聚類數據相對于所述第一聚類結果的每個聚簇的隸屬度;
基于多個隸屬度矩陣,對所述多個待聚類數據進行聚類,得到所述目標聚類事件的第二聚類結果,以確定所述多個待聚類數據的類別。
另一方面,提供了一種對數據進行聚類的裝置,所述裝置包括:
獲取模塊,用于獲取目標聚類事件的多個待聚類數據;
第一聚類模塊,用于通過多種聚類算法分別對所述多個待聚類數據進行聚類,得到多個第一聚類結果;
確定模塊,用于對于每個第一聚類結果,確定所述第一聚類結果下所述多個待聚類數據的隸屬度矩陣,所述隸屬度矩陣表示在所述第一聚類結果下每個待聚類數據相對于所述第一聚類結果的每個聚簇的隸屬度;
第二聚類模塊,用于基于多個隸屬度矩陣,對所述多個待聚類數據進行聚類,得到所述目標聚類事件的第二聚類結果,以確定所述多個待聚類數據的類別。
另一方面,提供了一種電子設備,所述電子設備包括處理器和存儲器;所述存儲器存儲有至少一條程序代碼,所述至少一條程序代碼用于被所述處理器執行以實現如上述方面所述的對數據進行聚類的方法。
另一方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有至少一條程序代碼,所述至少一條程序代碼用于被處理器執行以實現如上述方面所述的對數據進行聚類的方法。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





