[發明專利]基于分子內聚力理論的數據聚類方法無效
| 申請號: | 201110032779.1 | 申請日: | 2011-01-30 |
| 公開(公告)號: | CN102087667A | 公開(公告)日: | 2011-06-08 |
| 發明(設計)人: | 余春艷;張棟;王秀;姜云飛;李建明 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分子 內聚力 理論 數據 方法 | ||
1.一種基于分子內聚力理論的數據聚類方法,其特征在于:對于高維空間上具有N個數據點的數據集,設每個數據點為一個分子,設多個數據點形成的一個聚類為一個分子團,基于分子內聚力理論按如下步驟進行數據聚類:
步驟(1):利用分子勢能公式分別計算兩兩數據點之間的內聚力能量值,并保存;
步驟(2):各數據點并行尋找能使合并總能量降低且降到最低的數據點,與其合并為一個聚類,根據聚類完成的先后順序,當一個數據點A被另一數據點B合并為一個聚類后,所述數據點A不再主動尋找與其聚類的數據點,也不再以單個數據點形式作為其他數據點的聚類選擇對象;通過該步驟得到多個聚類和未找到使合并總能量降低數據點而無法聚類的數據點;
步驟(3):步驟(2)得到的各數據點和聚類并行尋找能使合并總能量降低且降到最低的數據點或聚類,與其合并為一個新的聚類,根據聚類完成的先后順序,當一個數據點或聚類C被另一數據點或聚類D合并為一個新的聚類后,所述數據點或聚類C不再主動尋找與其聚類的數據點或聚類,也不再以原形式作為其他數據點或聚類的聚類選擇對象;
步驟(4):重復步驟(3),直至所有數據點或聚類都無法使其他數據點或聚類能量降低;
步驟(5):所有數據點聚類完成,并得到數據點最終的類簇及其類別數目。
2.根據權利要求1所述的基于分子內聚力理論的數據聚類方法,其特征在于:兩兩數據點之間的內聚力能量值的計算公式為:
其中,表示φ(r)表示數據點之間的內聚力能量值,表示數據點之間的斥力,表示數據點之間的引力,r表示數據點之間的距離,A、B、n、m是大于零的恒量,且n?>m。
3.根據權利要求1或2所述的基于分子內聚力理論的數據聚類方法,其特征在于:一個數據點或聚類加入新的數據點后總能量值的計算公式為:
其中,Etotal表示總能量值,φij(rij)表示數據點i與數據點j之間的內聚力能量值,U表示數據點或聚類未加入新的數據點前的能量值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110032779.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種軟件重用模塊的保護方法及裝置
- 下一篇:一種新聞評論頁面的爬取方法及系統





