[發(fā)明專利]一種基于多示例學(xué)習(xí)的局部離群點檢測方法在審
| 申請?zhí)枺?/td> | 201811283345.7 | 申請日: | 2018-10-24 |
| 公開(公告)號: | CN111090678A | 公開(公告)日: | 2020-05-01 |
| 發(fā)明(設(shè)計)人: | 秦嶺;鄧浩;楊小健 | 申請(專利權(quán))人: | 南京工業(yè)大學(xué) |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/215;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 211816 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 示例 學(xué)習(xí) 局部 離群 檢測 方法 | ||
1.一種基于多示例學(xué)習(xí)的局部離群點檢測方法,其特征在于,包括以下步驟:
步驟一、建立數(shù)據(jù)采集通道:將企業(yè)的現(xiàn)場實時監(jiān)控數(shù)據(jù)通過傳感器傳到OPC服務(wù)端,客戶端讀取采集信息后,計算并存入數(shù)據(jù)庫;
步驟二、工業(yè)控制數(shù)據(jù)的清洗:所述步驟一采集得到工業(yè)控制數(shù)據(jù)集,對其進(jìn)行數(shù)據(jù)的清洗,去除一些不必要的數(shù)據(jù);
步驟三、初始化數(shù)據(jù)集:根據(jù)MIL原理,對數(shù)據(jù)進(jìn)行處理,提取MIL包,并確定MIL包內(nèi)的示例,將數(shù)據(jù)集合轉(zhuǎn)化成MIL包的集合。根據(jù)專家設(shè)定的語義,原先糅雜在一起的對象被有條理的劃分到各個示例中,對象整體則被一個裝有多個示例的包表示,包中的每個示例代表此對象在其特定語義下的解釋。對象的整體特征通過包被完整地、結(jié)構(gòu)化地保留了下來,避免了傳統(tǒng)算法提取過程中的丟失。同時采用退化策略,通過矩陣轉(zhuǎn)置、子集提取將多示例問題退化成了傳統(tǒng)的單示例問題,將對MIL塊的問題轉(zhuǎn)化為對多個示例塊的問題,有效的解決了在復(fù)雜對象集上的問題,提高算法檢測的全面性;
步驟四、取出MIL包中的示例,計算k距離鄰域、局部可達(dá)密度、局部離群因子等數(shù)據(jù),直到MIL包中沒有數(shù)據(jù);
步驟五、自適應(yīng)權(quán)重調(diào)整策略:根據(jù)示例的特征,在權(quán)重函數(shù)計算過程中加入自適應(yīng)懲罰策略,通過引入懲罰函數(shù)和懲罰因子,根據(jù)不同示例集自身的特點自適應(yīng)調(diào)整權(quán)重函數(shù);
步驟六、綜合局部離群點因子的計算:計算多示例對象的綜合局部離群點因子;
步驟七、確定局部離群點:執(zhí)行完步驟六以后,根據(jù)綜合局部離群因子的大小,確定局部離群點。
2.根據(jù)權(quán)利要求1所述的一種基于多示例學(xué)習(xí)的局部離群點檢測方法,其特征在于,所述步驟四的具體包括以下步驟:
步驟4.1:計算對象o的k-距離(記為distk(o))。對于給定數(shù)據(jù)集D和自然數(shù)k,使得o與另一個對象p∈D之間的距離(記為dist(o,p)),滿足條件:
(1)至少有k個對象o′∈D-{o},使得dist(o,o′)≤dist(o,p)。
(2)至少有k-1個對象o″∈D-{o},使得dist(o,o″)≤dist(o,p)。
換言之,distk(o)是o與其第k個最近鄰之間的距離。
步驟4.2:計算對象o的k-距離鄰域。o的k-鄰域包含其到o的距離不大于distk(o)的所有對象,記為:
Nk(o)={o′|o′∈D,dist(o,o′)≤distk(o)}
步驟4.3:計算對象o′到o的可達(dá)距離reachdistk(o←o′)=max{distk(o),dist(o,o′)}。對于兩個對象o和o′,如果dist(o,o′)≥distk(o),則從o′到o的可達(dá)距離是dist(o,o′),否則是distk(o)。記為:
reachdistk(o←o′)=max{distk(o),dist(o,o′)}
步驟4.4:計算局部可達(dá)密度(lrdk(o))。對象o的局部可達(dá)密度是對象o與它的distk(o)的平均可達(dá)距離的倒數(shù)。計算公式為:
步驟4.5:計算局部離群點因子(LOFk(o))。局部離群點因子是o的可達(dá)密度與o的k-最鄰近的可達(dá)密度之比的平均值。對象o的局部可達(dá)密度低,并且o的k-最鄰近的局部可達(dá)密度越高,局部離群點因子越高。計算公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京工業(yè)大學(xué),未經(jīng)南京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811283345.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





