[發明專利]數據聚類方法及裝置在審
| 申請號: | 201610861831.7 | 申請日: | 2016-09-28 |
| 公開(公告)號: | CN107870952A | 公開(公告)日: | 2018-04-03 |
| 發明(設計)人: | 杭文龍;梁爽;王瓊;王平安 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳中一專利商標事務所44237 | 代理人: | 張全文 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 方法 裝置 | ||
技術領域
本發明屬于數據挖掘領域,尤其涉及數據聚類方法及裝置。
背景技術
數據聚類分析是指根據數據集自身的屬性將其劃分成不同的類別,并使得同類別中的數據具有較大的相似性且不同類別中的數據具有較大的相異性。數據聚類分析是一種無監督的數據挖掘方法,是數據挖掘領域研究的重點與難點。基于聚類的數據分析技術,可以在沒有或很少先驗知識的情況下對數據內容進行分析,以輔助研究人員對隱藏在數據集內部的信息進行分析、挖掘。目前,在某些實際應用中由于某些生產過程數據的保密性較高或高代價產業導致的低產量等收集得到的數據樣本通常十分有限,從而造成數據匱乏的場景時常出現。在面對此類場景下的聚類任務時,由于數據匱乏導致的數據集幾何、分布屬性缺失致使傳統的聚類分析方法往往不能取得令人滿意的效果。
目前實現目標數據匱乏情況下的數據聚類分析方法尚不多見。通過遷移學習機制利用歷史相似數據來輔助目標數據匱乏情況下的數據聚類分析是一種行之有效的方法而受到廣泛關注?;谧V聚類的遷移譜聚類方法通過將遷移學習機制引入到譜聚類方法中,利用歷史數據與目標數據的某些共享特性完成對目標數據匱乏情況下的數據聚類分析。但是基于譜聚類的遷移聚類方法需要人為事先輸入聚類類別數,然而現實情況中的某些聚類任務的先驗知識并不可知,因此基于譜聚類的遷移聚類方法在此類情況下失效。
發明內容
本發明實施例的目的在于提供數據聚類方法及裝置,旨在解決目前目標數據匱乏且無任何先驗知識的情況下無法實現數據聚類分析的問題。
本發明實施例是這樣實現的,一種數據聚類方法,包括:
獲取歷史數據與所述歷史數據聚類中心;
結合獲取到的歷史數據與所述歷史數據聚類中心構建目標數據與所述目標數據潛在聚類中心的距離關系
對落在所述歷史數據聚類中心近鄰的所述目標數據潛在聚類中心點構建懲罰項Δk(c);
根據所述和所述Δk(c)構建目標函數max S(c);
通過所述目標函數將歷史數據遷移至目標數據,得到聚類結果。
本發明實施例的另一目的在于提供一種數據聚類裝置,包括:
獲取單元,用于獲取歷史數據與所述歷史數據聚類中心;
第一構建單元,用于結合獲取到的歷史數據與所述歷史數據聚類中心構建目標數據與所述目標數據潛在聚類中心的距離關系
第二構建單元,用于對落在所述歷史數據聚類中心近鄰的所述目標數據潛在聚類中心點構建懲罰項Δk(c);
第三構建單元,用于根據所述和所述Δk(c)構建目標函數max S(c);
聚類單元,用于通過所述目標函數將歷史數據遷移至目標數據,得到聚類結果。
在本發明實施例中,綜合考慮歷史數據和目標數據的特性,利用歷史數據輔助目標數據學習,在無需任何先驗知識的情況下,實現目標數據匱乏情況下數據聚類分析。
附圖說明
圖1是本發明實施例提供的數據聚類方法的示意圖;
圖2是本發明實施例提供的數據聚類方法的流程圖;
圖3是本發明實施例提供的數據聚類方法的分布匹配示例圖;
圖4是本發明實施例提供的數據聚類方法的幾何特征保留示意圖;
圖5是本發明實施例提供的數據聚類方法的TAP因子圖;
圖6是本發明實施例提供的數據聚類方法的聚類結果示意圖;
圖7是本發明實施例提供的數據聚類裝置的結構框圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用于解釋本發明,并不用于限定本發明。
本發明實施例提出一種基于近鄰傳播的遷移聚類TAP(Transfer Affinity Propagation)方法。如圖1所示,所述TAP方法在歷史數據和目標數據分布相似的情況下,綜合考慮歷史數據統計特性、目標數據統計特性和目標數據幾何特征的基礎上改進近鄰傳播AP(Affinity Propagation)算法中的消息傳遞機制使其具備知識遷移能力,從而達到輔助目標數據聚類分析的目的。
圖2是本發明實施例提供的數據聚類方法的流程圖。
在S201中,獲取歷史數據與所述歷史數據聚類中心。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610861831.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種干粉發酵混合牛飼料的制備方法
- 下一篇:一種干草飼料
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





