[發(fā)明專利]無參數(shù)的k均值聚類方法在審
| 申請?zhí)枺?/td> | 201810553412.6 | 申請日: | 2018-06-01 |
| 公開(公告)號: | CN108764359A | 公開(公告)日: | 2018-11-06 |
| 發(fā)明(設計)人: | 侯濤;劉富;康冰;劉云;李丁園;姜守坤;王柯;苗巖;梁藝馨 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 吉林長春新紀元專利代理有限責任公司 22100 | 代理人: | 白冬冬 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 駕駛 人體生物特征 數(shù)據(jù)處理技術 待分類數(shù)據(jù) 分類數(shù)據(jù)集 安全行駛 保障車輛 分類識別 分類數(shù)據(jù) 駕駛行為 聚類分析 疲勞駕駛 汽車駕駛 輸出結果 大數(shù)據(jù) 離散度 聚類 偏好 預警 采集 篩選 圖像 分類 汽車 決策 分析 | ||
一種無參數(shù)的k均值聚類方法,屬于數(shù)據(jù)處理技術領域。本發(fā)明的目的是為圖像、人體生物特征、汽車駕駛員等對象采集到的多分類數(shù)據(jù)集,提供一種無參數(shù)的
技術領域
本發(fā)明屬于數(shù)據(jù)處理技術領域。
背景技術
K均值算法(k-means clustering method,CM)是一種常用的無監(jiān)督聚類算法,目前已被廣泛應用于圖像處理領域進行圖像分割;用于生物特征識別領域進行人體的身份驗證;用于汽車駕駛姿態(tài)、行為的分類識別,便于提前預警疲勞駕駛,保障車輛行駛安全。然而該算法在對各個領域采集到的數(shù)據(jù)集進行聚類分析時,需要人為預先設定兩個參數(shù),一個是代表聚類個數(shù)的k參數(shù),另一個是初始聚類中心點。這兩個參數(shù)的選取,直接影響著聚類結果,使聚類陷入局部最優(yōu),導致不準確。目前,改進的一些k-mean算法通常通過拉網式訓練來選擇最優(yōu)的參數(shù),這并不高效。為了解決這些問題,本發(fā)明提出一種無參數(shù)的智能k均值聚類算法(paremeter-free Intelligent k-Mean,IKM)。本發(fā)明能對從圖像、人體生物特征、汽車駕駛員等對象采集到的多類大數(shù)據(jù)集進行聚類實驗,準確評估出聚類數(shù)和聚類初值,從而進行優(yōu)化聚類。
發(fā)明內容
本發(fā)明的目的是為圖像、人體生物特征、汽車駕駛員等對象采集到的多分類數(shù)據(jù)集,提供一種無參數(shù)的k均值聚類方法,其適用于對各種多分類大數(shù)據(jù)集進行分析。
本發(fā)明的步驟是:
第一步計算待分類數(shù)據(jù)集中各個數(shù)據(jù)點的密度;
第二步計算分類數(shù)據(jù)集中各個數(shù)據(jù)點的離散度;
第三步篩選初始類中心和聚類數(shù);
第四步是用傳統(tǒng)k-mean進行聚類分析并輸出結果。
本發(fā)明所述的計算待分類數(shù)據(jù)集中各個數(shù)據(jù)點的密度:
(1)先計算數(shù)據(jù)集中每個數(shù)據(jù)點xi的鄰域密度,具體計算方法如下:
對計算數(shù)據(jù)點xi的鄰域U(xi)={xj|xj∈Xanddij≤dl}(i≠j),其中dij=d(xi,xj),表示兩個數(shù)據(jù)點i和j之間的歐式距離;距離閾值dl定義為數(shù)據(jù)集X中樣本之間所有距離的平均值的1/10,可表示為:
(2)數(shù)據(jù)集X中的任意樣本點xi的密度定義為點xi的鄰域U(xi)內所包含樣本點的歐式距離之和,可表達為:計算每個數(shù)據(jù)點xi的密度deni之后,用以下公式對其進行歸一化處理:d1i=deni/max(deni)。
本發(fā)明所述的計算分類數(shù)據(jù)集中各個數(shù)據(jù)點的離散度:即數(shù)據(jù)集X中各個數(shù)據(jù)點xi的離散度ρi,
密度最大的數(shù)據(jù)點的離散度ρi設定為該點與數(shù)據(jù)集X中所有點的最大距離,公式表達為:
ρi=max(dij) (2)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810553412.6/2.html,轉載請聲明來源鉆瓜專利網。





