日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]增量聚類方法和裝置在審

專利信息
申請號: 201910204066.5 申請日: 2019-03-18
公開(公告)號: CN110110736A 公開(公告)日: 2019-08-09
發明(設計)人: 張勇;郭達;張朔銘;鄧海勤;高志勇;宋云鵬 申請(專利權)人: 愛動超越人工智能科技(北京)有限責任公司
主分類號: G06K9/62 分類號: G06K9/62
代理公司: 北京路浩知識產權代理有限公司 11002 代理人: 王瑩;吳歡燕
地址: 100007 北京市東城*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 數據點 聚類 鄰域 方法和裝置 聚類結果 層次聚類算法 聚類模塊 密度可變 掃描模塊
【說明書】:

發明實施例提供增量聚類方法和裝置,用于在根據基于密度的層次聚類算法獲得首次聚類結果的基礎上,對首次聚類后每次新增數據點進行聚類。其中,方法包括:對于新增數據點,以全部類的類密度的最大值作為鄰域半徑,獲取所述新增數據點的鄰域內的數據點;根據新增數據點的鄰域內的數據點所屬的每個類的類密度,確定所述新增數據點所屬的類。裝置包括:鄰域掃描模塊和增量聚類模塊。本發明實施例提供的增量聚類方法和裝置,實現了在密度可變的聚類結果的基礎上進行增量聚類。

技術領域

本發明實施例涉及數據處理技術領域,尤其涉及增量聚類方法和裝置。

背景技術

聚類是將物理或抽象對象的集合分成由類似的對象組成的多個類的過程,即將對象分類到不同的類或者簇的過程,同一個類中的對象有很大的相似性,不同類之間的對象有很大的相異性。

聚類方法包括很多種類?;诿芏群突趯哟蔚木垲愃惴m然簡單易行,廣受歡迎,但是現有的基于密度的算法有著一些局限性。

部分基于密度的聚類算法,基于全局密度,只能對數據提供一種比較單一的標簽,使用單一的密度閾值,對于密度不均勻的數據集,不能產生合適的具有特性的聚類效果;部分基于層次的聚類不能自適應的簡化層次成為一種簡單的,可分辨的,具有代表性的,最有意義的聚類;部分基于層次的聚類只是從全局密度閾值中提取一種單一的劃分,這對由不同密度等級的聚類對象,不能得出有意義的聚類;很多聚類方法常常依靠多個具有重要影響的參數。

其中,基于密度的聚類方法與其它的聚類方法不同的是,它不是基于各種距離,而是基于密度,只要一個區域中的點的密度大于某個閥值,就把它加到與之相近的聚類中去。這樣能夠克服基于距離的聚類算法只能發現“類圓形”的聚類的缺點。例如,DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法就是基于密度的聚類方法中一種典型算法,DBSCAN算法將簇定義為密度相連的點的最大集合,能夠把具有足夠高密度的區域劃分為簇,并可以在噪聲的空間數據庫中發現任意形狀的聚類。DBSCAN算法引入了核心對象的概念和兩個初始參數Eps(掃描半徑)和MinPts(最小包含對象數)。如果存在一個對象,在距它Eps的范圍內有不少于MinPts個對象,則該對象就是核心對象。核心對象和它的Eps范圍內的鄰居對象形成一個簇。在一個簇內如果出現多個對象都是核心對象,則以這些核心對象為中心的簇要合并。但是,此種聚類算法的聚類結果對參數Eps和MinPts的取值非常敏感,即Eps和MinPts的取值不同,產生不同的聚類結果,從而導致聚類結果的不確定性?;诿芏鹊木垲愑捎谄鋮档碾y調節性,聚類的結果在密度大的地方往往數量很大,而密度小的地方數量較少,這對于大多數應用場景(比如定位)來說是不利的條件,因為當數據匹配到密度大的類中時,由于該類的數據很多,會造成在該類中匹配的計算量很大,而且該類中的數據不一定對最后的結果有用。原始的基于密度的聚類對于真實世界中復雜的數據效果并不好。

增量聚類方法是當有一批聚類結果時,新增加一些數據,只對新增的數據進行聚類,并對已有的聚類結果進行增量式修改,不需要對新增數據后的整個數據集進行重新聚類。但是,相關技術中的聚類方法和增量聚類方法均無法同時保證高精確率和高召回率。例如,基于密度層次的HDBSCAN(Hierarchical Density-Based Spatial Clustering ofApplications with Noise)算法能獲得較好的密度可變的聚類結果,但在做增量更新時,無法有效更新已有的聚類狀態,只能在原有的聚類基礎上,靠分類來容納新增的對象。

發明內容

針對現有技術存在的無法在密度可變的聚類結果的基礎上進行增量聚類的問題,本發明實施例提供一種增量聚類方法和裝置。

本發明實施例提供一種增量聚類方法,所述方法用于在根據基于密度的層次聚類算法獲得首次聚類結果的基礎上,對首次聚類后每次新增數據點進行聚類;所述方法包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于愛動超越人工智能科技(北京)有限責任公司,未經愛動超越人工智能科技(北京)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910204066.5/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲精品乱码久久久久久蜜糖图片 | 欧美乱偷一区二区三区在线| 国产一区二区在| aaaaa国产欧美一区二区| 国产农村妇女精品一区二区| 久久99精品久久久久国产越南| 欧美精品一区二区三区视频| 国产乱xxxxx97国语对白| 午夜精品一区二区三区在线播放| 日韩av电影手机在线观看| 三级电影中文| 午夜影院色| 精品国产亚洲一区二区三区| 亚洲欧美国产一区二区三区| 少妇性色午夜淫片aaa播放5| 亚洲w码欧洲s码免费| 色婷婷综合久久久久中文| 好吊色欧美一区二区三区视频 | 99久久婷婷国产亚洲终合精品 | 国产第一区二区三区| 96国产精品| 91波多野结衣| 国产亚洲精品久久午夜玫瑰园 | 91理论片午午伦夜理片久久| 亚洲无人区码一码二码三码| 香蕉av一区| 小萝莉av| 久久精品国产色蜜蜜麻豆| 久久精品com| 久久久精品免费看| 国产午夜精品免费一区二区三区视频| 亚洲国产精品91| 99久久夜色精品| 国产日韩精品久久| 国产一级片大全| 免费a一毛片| 国产不卡三区| 久久久久久久国产| 7777久久久国产精品| 日韩精品在线一区二区三区| 日本一区二区三区免费视频| 国产伦精品一区二区三区免费下载| 欧美精品一区二区久久久| 日韩欧美多p乱免费视频| 狠狠躁日日躁狂躁夜夜躁av| 欧美中文字幕一区二区三区| 99国产精品久久久久99打野战| 国产日韩精品一区二区| 亚洲国产精品一区在线观看| 午夜在线观看av| 亚洲精品国产一区二区三区| 久久福利免费视频| 午夜精品一二三区| 国产午夜一级一片免费播放| 国产精品一区二区毛茸茸| 国产欧美一区二区三区在线看| 玖玖精品国产| 午夜精品一区二区三区在线播放| 久久国产欧美一区二区三区免费| 国产精品96久久久久久久| 国产www亚洲а∨天堂| 91人人精品| 欧美日韩中文字幕三区| 久久人人97超碰婷婷开心情五月| 国产日韩麻豆| 欧美一区二区精品久久| 91一区在线| 日韩久久电影| 欧美视频1区| 欧美一区二区三区免费观看视频| 日韩午夜一区| 精品国产1区2区3区| 日本一区二区免费电影| 大bbw大bbw巨大bbb| 亚洲欧美另类久久久精品2019| 婷婷嫩草国产精品一区二区三区| 国产大片一区二区三区| 97人人模人人爽人人喊小说| 欧美一区二区三区性| 精品国产乱码久久久久久虫虫| 国产精品中文字幕一区| 日韩av在线播|