[發明專利]一種基于分布密度的多源大氣數據聚類方法有效
| 申請號: | 202010314605.3 | 申請日: | 2020-04-21 |
| 公開(公告)號: | CN111507415B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 樊仲欣 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06F18/23 | 分類號: | G06F18/23;G06F17/16;G06F16/901;G06F16/906 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210044 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分布 密度 大氣 數據 方法 | ||
1.一種基于分布密度的多源大氣數據聚類方法,其特征在于,包括以下步驟:
(1)構建多源大氣數據集DS,并判斷多源大氣數據集DS的聚類趨勢;所述多源大氣數據集DS為一個M維數據組成的數據量為N的數據集;
(2)生成多源大氣數據集的距離矩陣DM的全鄰域分布密度矩陣DDM;
(3)以分布密度閾值ddth為參數,劃分出全鄰域分布密度矩陣DDM的密度峰值與離散點;
(4)截取全體數據的邊矩陣E將簇邊界點合并入簇核,得到聚類結果;
所述步驟(3)包括以下步驟:
(31)設待標記頂點唯一標識集合AID=ID,密度峰值的頂點唯一標識集合離散點的頂點唯一標識集合并創建空隊列QU;
(32)從AID中選擇第1個頂點唯一標識AID(1)并查找其在DDM中的對應行DDMrAID(1),將DDMrAID(1)按IrAID(1)重新排序得到順序排列的DDMsrAID(1),然后從第2個元素開始依序遍歷DDMsrAID(1)找到前ci個大于閾值ddth的元素,如果ci=0則將AID(1)從AID刪除再加入到NID集合中并跳轉至步驟(35),否則將ci個元素在DDM中對應列的唯一標識ID(IrAID(1)(2))…ID(IrAID(1)(ci+1))和AID取交集后入隊列QU,并將AID(1),ID(IrAID(1)(2))…ID(IrAID(1)(ci+1))從AID刪除再加入到新建集合CIDnew={AID(1),ID(IrAID(1)(2))…ID(IrAID(1)(ci+1))};
(33)如QU為空則進入步驟(34),否則頂點唯一標識ID(i)出隊列QU,查找ID(i)在DDM中的對應行DDMrID(i),將DDMrID(i)按IrID(i)重新排序得到DDMsrID(i),然后從第2個元素開始依序遍歷DDMsrID(i)找到前ci個大于閾值ddth的元素,如果ci=0跳轉至本步驟開頭,否則將ci個元素在DDM中對應列的唯一標識ID(IrID(i)(2))…ID(IrID(i)(ci+1))和AID取交集后入隊列QU,并將ID(i),ID(IrID(i)(2))…ID(IrID(i)(ci+1))從AID刪除再更新集合CIDnew=CIDnew∪{ID(i),ID(IrID(i)(2))…ID(IrID(i)(ci+1))},跳轉至本步驟開頭;
(34)檢查最新生成并更新完成的集合CIDnew,如果CIDnew和CID集合中的某些子集合CIDj,…CIDk的交集不為空,則CIDnew=CIDnew∪CIDj∪…CIDk,并將CIDj,…CIDk從CID刪除后將CIDnew加入到CID成為新增的子集合;
(35)如AID不為空則轉到步驟(32)繼續執行,否則得到密度峰值頂點集合CID和離散頂點集合NID并進入步驟(4)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010314605.3/1.html,轉載請聲明來源鉆瓜專利網。





