[發(fā)明專利]一種基于偏離特征的離群點(diǎn)挖掘方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710599251.X | 申請(qǐng)日: | 2017-07-21 |
| 公開(公告)號(hào): | CN107562778B | 公開(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 王紅濱;馮夢(mèng)園;何鳴;王念濱;尹新亮;顧正浩;蘇暢;童鵬鵬;曾慶宇;張海彬 | 申請(qǐng)(專利權(quán))人: | 哈爾濱工程大學(xué) |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/26 |
| 代理公司: | 哈爾濱市松花江專利商標(biāo)事務(wù)所 23109 | 代理人: | 牟永林 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區(qū)*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 偏離 特征 離群 挖掘 方法 | ||
1.一種基于偏離特征的離群點(diǎn)挖掘方法,其特征在于,對(duì)字符軌跡進(jìn)行離群點(diǎn)挖掘的過程包括以下步驟:
(1)將數(shù)據(jù)集D的各個(gè)維度劃分為h個(gè)等間距的間隔,則整個(gè)數(shù)據(jù)集被劃分為hd個(gè)網(wǎng)格;
(2)將每個(gè)數(shù)據(jù)點(diǎn)xi∈D與網(wǎng)格索引j={1,...,hd}做一個(gè)關(guān)聯(lián),如果一個(gè)網(wǎng)格中不包含數(shù)據(jù)點(diǎn),則不考慮該網(wǎng)格;
(3)對(duì)于劃分形成的空間中的各個(gè)網(wǎng)格j,求出網(wǎng)格的質(zhì)心Cj,并計(jì)算質(zhì)心Cj的局部離群因子Lofk(Cj);
(4)計(jì)算每個(gè)數(shù)據(jù)對(duì)象的局部離群因子值,數(shù)據(jù)集中對(duì)象的局部離群因子等于所屬網(wǎng)格質(zhì)心的離群因子。
2.根據(jù)權(quán)利要求1所述的一種基于偏離特征的離群點(diǎn)挖掘方法,其特征在于,所述步驟(3)中的網(wǎng)格的質(zhì)心Cj和質(zhì)心Cj的局部離群因子Lofk(Cj)計(jì)算過程如下:
(3.1)計(jì)算質(zhì)心Cj的第k距離k_dist(Cj);對(duì)于數(shù)據(jù)空間中的兩個(gè)對(duì)象Cj和o,以歐式距離為度量,對(duì)給定的正整數(shù)k,將Cj的第k距離概括為Cj與o之間的距離,記為k_dist(Cj),其中對(duì)象o滿足如下條件為:至少存在k個(gè)對(duì)象o′∈D\{Cj}滿足d(Cj,o′)≤d(Cj,o);至少存在k-1個(gè)對(duì)象o′∈D\{Cj}滿足d(Cj,o′)<d(Cj,o);
(3.2)計(jì)算質(zhì)心Cj的第k距離領(lǐng)域Nk(Cj);將數(shù)據(jù)空間中與質(zhì)心Cj的距離小于或者等于k_dist(Cj)的質(zhì)心對(duì)象集合定義為Nk(Cj),用公式表示為:
Nk(Cj)={o|d(Cj,o)≤k_dist(Cj)};
(3.3)計(jì)算質(zhì)心Cj與其Nk(Cj)中數(shù)據(jù)點(diǎn)的可達(dá)距離;質(zhì)心Cj相對(duì)于其他質(zhì)心o的可達(dá)距離是指Cj的第k距離和Cj與o之間距離的較大值,用如下公式表示為:
reach_distk(Cj,o)=max{k_dist(o),d(Cj,o)};
其中,o∈Nk(Cj);
(3.4)計(jì)算質(zhì)心Cj的局部可達(dá)密度lrdk(Cj);lrdk(Cj)是將質(zhì)心Cj與其第k距離領(lǐng)域Nk(Cj)中所有對(duì)象的平均可達(dá)距離求倒,計(jì)算公式為:
(3.5)通過以上得出的結(jié)果,求出質(zhì)心Cj的局部離群因子Lofk(Cj),公式為:
3.根據(jù)權(quán)利要求1所述的一種基于偏離特征的離群點(diǎn)挖掘方法,其特征在于:所述步驟(4)中計(jì)算每個(gè)數(shù)據(jù)對(duì)象的局部離群因子值,如果數(shù)據(jù)集D中的對(duì)象xi屬于網(wǎng)格j,則該對(duì)象的局部離群因子表示為:
LofG_k(xi)=Lofk(Cj)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工程大學(xué),未經(jīng)哈爾濱工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710599251.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:數(shù)據(jù)處理方法及其設(shè)備
- 下一篇:
- 同類專利
- 專利分類





