[發明專利]一種聚類方法、裝置、設備及存儲介質在審
申請號: | 202110363314.8 | 申請日: | 2021-04-02 |
公開(公告)號: | CN113065597A | 公開(公告)日: | 2021-07-02 |
發明(設計)人: | 吳志彪 | 申請(專利權)人: | 北京京東拓先科技有限公司 |
主分類號: | G06K9/62 | 分類號: | G06K9/62 |
代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100176 北京市大興區北京經濟*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 方法 裝置 設備 存儲 介質 | ||
1.一種聚類方法,其特征在于,包括:
獲取待處理數據集,并基于預設排序算法對所述待處理數據集中的待處理數據進行排序,得到排序數據集;
將所述排序數據集中滿足預設選取規則的待處理數據作為目標待處理數據,并根據所述排序數據集中各待處理數據對應的排序結果,確定與所述目標待處理數據對應的鄰域待處理數據;其中,所述鄰域待處理數據與所述目標待處理數據之間的數據距離小于預設半徑;
如果所述鄰域待處理數據的數量超過預設密度閾值,則將所述目標待處理數據作為核心數據,并基于所述核心數據和所述鄰域待處理數據,確定聚類數據集。
2.根據權利要求1所述的方法,其特征在于,所述根據所述排序數據集中各待處理數據對應的排序結果,確定與所述目標待處理數據對應的鄰域待處理數據,包括:
獲取與所述目標待處理數據對應的至少一個待處理數據,并根據所述各待處理數據相對于目標待處理數據的排序結果,將各所述待處理數據依次作為參考待處理數據;
如果當前參考待處理數據與目標待處理數據之間的數據距離小于等于預設半徑,則將所述當前參考待處理數據作為鄰域待處理數據,并獲取下一參考待處理數據;
如果當前參考待處理數據與目標待處理數據之間的數據距離大于預設半徑,則生成結束指令;其中,所述結束指令用于指示停止執行數據距離的判斷操作。
3.根據權利要求2所述的方法,其特征在于,所述獲取與所述目標待處理數據對應的至少一個待處理數據,包括:
以所述目標待處理數據為圓心,依次獲取與至少一個預設角度范圍分別對應的至少一個待處理數據;其中,各預設角度范圍之間角度不相交。
4.根據權利要求3所述的方法,其特征在于,所述依次獲取與至少一個預設角度范圍分別對應的至少一個待處理數據,包括:
獲取與第一預設角度范圍對應的至少一個待處理數據;
當檢測到與所述第一預設角度范圍對應的結束指令時,獲取與第二預設角度范圍對應的至少一個待處理數據,直到預設角度范圍的數量達到預設數量閾值或者預設角度范圍之和滿足預設角度閾值。
5.根據權利要求1所述的方法,其特征在于,所述預設選取規則包括待處理數據的標識信息為未標識,相應的,所述方法還包括:
將所述排序數據集中與所述聚類數據集對應的待處理數據的標識信息修改為已標識,以及將鄰域待處理數據的數量未超過預設密度閾值的目標待處理數據的標識信息修改為已標識。
6.根據權利要求1所述的方法,其特征在于,所述基于預設排序算法對所述待處理數據集中的待處理數據進行排序,得到排序數據集,包括:
如果所述待處理數據包含多維坐標數據,則基于預設編碼規則,將所述多維坐標數據轉換為一維坐標數據;
基于所述一維坐標數據對所述待處理數據集中的待處理數據進行排序,得到排序數據集。
7.根據權利要求1所述的方法,其特征在于,所述基于所述核心數據和所述鄰域待處理數據,確定聚類數據集,包括:
將所述核心數據作為當前核心數據;
判斷所述當前核心數據對應的鄰域待處理數據中是否存在屬于下一核心數據的鄰域待處理數據;
如果是,則將所述下一核心數據作為當前核心數據,重復執行判斷所述當前核心數據對應的鄰域待處理數據中是否存在屬于下一核心數據的鄰域待處理數據的操作;
如果否,則基于至少一個核心數據和各所述核心數據分別對應的鄰域待處理數據,確定聚類數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東拓先科技有限公司,未經北京京東拓先科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110363314.8/1.html,轉載請聲明來源鉆瓜專利網。