[發明專利]一種局部分塊的一類支持向量數據描述方法有效
| 申請號: | 201410071393.5 | 申請日: | 2014-02-28 |
| 公開(公告)號: | CN103870682B | 公開(公告)日: | 2017-04-19 |
| 發明(設計)人: | 蔣云良;胡文軍;王培良;陶劍文;樓俊鋼;皋軍 | 申請(專利權)人: | 湖州師范學院 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 杭州宇信知識產權代理事務所(普通合伙)33231 | 代理人: | 張宇娟 |
| 地址: | 313000*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 局部 分塊 一類 支持 向量 數據 描述 方法 | ||
技術領域
本發明涉及數據異常檢測領域,尤其涉及一種局部分塊的一類支持向量數據描述方法。
背景技術
現有通過對正常樣本數據的學習進而獲得其特征屬性的過程稱為異常檢測,隸屬于一類分類問題。在許多應用領域,如假幣識別,醫療診斷,機器故障診斷,生物發酵過程異常監測,通信領域輻射源個體識別等,獲得異常數據的可能性很小,且獲取的過程需要花費大量的人力和物力。因此,異常檢測在近幾十年里得到了廣泛關注。
一類支持向量數據描述的異常檢測方法一直得到較大關注。許多學者提出了諸多改進版本,如小球體大間隔方法、多球支持向量數據描述方法等。上述異常檢測方法在構建數學模型時,僅僅考慮到數據的全局幾何結構,而忽略了數據的局部幾何結構,導致隱藏在局部結構中的信息丟失,降低了上述方法在異常數據檢測中的識別精度。
發明內容
本發明為了解決現有技術問題,既考慮到數據的全局幾何結構,也考慮到數據的局部幾何結構,設計一種實現有效的異常數據檢測的局部分塊的一類支持向量數據描述方法。
本發明的技術方案是:一種局部分塊的一類支持向量數據描述方法,包括如下步驟:
步驟1:對樣本集X=(x1,…,xN)進行局部分塊,得到各個局部分塊Pi(i=1,…,N),具體方法為:把xi對應最近鄰個數K的最近鄰樣本集所構成的局部區域稱為xi在樣本集X上的一個局部分塊,其中,表示xi的第p個最近鄰樣本點;
步驟2:計算重構系數其中,xi的局部重構系數h為熱核參數,得到重構系數矩陣W=(W1,…WN),用來權衡局部分塊內不同樣本對該局部區域內在幾何結構的貢獻程度;
步驟3:通過核函數計算核矩陣K,其中k(·,·)為核函數;
步驟4:設定核化模型:
其中通過拉格朗日獲得所述核化模型的對偶形式:
步驟5:將步驟2得到的重構系數矩陣和步驟3得到的核矩陣代入步驟4的對偶形式,得到拉格朗日乘子向量α:α=(α1,…,αN)T;
步驟6:根據決策函數
f(x)=R2+2[k(x,x1),…,k(x,xN)]Wα-k(x,x)-αT(WTKW)α對未知樣本x進行決策,其中核化后的球心:W是拉格朗日乘子αs滿足0<αs<C條件所對應樣本點xs的重構系數向量,若f(x)≥0,則x為正常樣本,否則為異常樣本。
作為一種優選,步驟2中的近鄰個數K從網格{2,3,…,14}中選擇。
作為一種優選,步驟2中的熱核參數h從網格表{2-14,2-13,…,213,214}中選擇。
作為一種優選,步驟3中的核函數k(·,·)選為高斯核函數:
k(xi,xj)=exp(-||xi-x||2/2σ2);
其中核帶寬參數σ=2mσ0,m={-4.5,-4.0,…,4.0,4.5};
σ0是樣本數據平均2范數的平方根。
綜上所述,本發明的有益效果是:提出的一類支持向量數據描述方法具有捕捉數據局部幾何結構能力,從而使得構建的數據模型具有更好異常數據檢測能力。
附圖說明
圖1為現有原始一類支持向量數據描述方法對半月形數據集的識別效圖;
圖2為本發明方法對半月形數據集的識別效圖;
具體實施方式
利用本發明進行異常數據檢測任務。本發明包括如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖州師范學院,未經湖州師范學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410071393.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種三合一2B鉛芯加工方法
- 下一篇:一種碳化2B鉛芯加工方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





