[發明專利]一種基于相互約束的模糊數據分類方法在審
| 申請號: | 201310715125.8 | 申請日: | 2013-12-20 |
| 公開(公告)號: | CN103886007A | 公開(公告)日: | 2014-06-25 |
| 發明(設計)人: | 令狐大智;李陶深;龐大蓮;梁戈夫;武新麗;汪濤;梁淑紅 | 申請(專利權)人: | 廣西大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京中譽威圣知識產權代理有限公司 11279 | 代理人: | 彭曉玲 |
| 地址: | 530004 廣西壯族*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 相互 約束 模糊 數據 分類 方法 | ||
技術領域
本發明涉及計算機信息技術領域,特別涉及一種基于相互約束的模糊數據分類方法。?
背景技術
模糊分類分析是當前非常重要的研究和應用課題,在工程技術和經濟領域有著廣泛的應用。?
模糊分類分析是基于模糊理論對已知類別信息的數據進行學習,獲取相應類別的模式規則,然后再通過模式規則對新來數據進行類別判定。模糊分類分析的關鍵是檢測準確度、對新數據的識別能力和一定的泛化處理能力,其核心是泛化處理能力。?
許多學者對模糊分類器的泛化能力進行了研究,從拓撲角度分,目前常見的有三種模糊分類器結構:超矩形、多面體型和橢圓型,但由于建立的基礎限制了它們的檢測效率和較大的模式庫規模。也有學者從遺傳算法、神經網絡和相互約束的角度給出了模糊分類算法,增強了算法的普適性,降低了模式庫的規模,但存在對訓練集數據要求高、訓練時間長、處理速度慢、結果不易解讀的問題。?
同時,在樣本數據分布較復雜的情況下,異類樣本所形成的集合圖型往往會出現相互重疊、圖形上存在較大拐點(如拓撲圖形棒槌狀)或者發現傳統的兩類數據在概念上可以作為同一類出現等情況,因此需要進行模式的合并更新,將原始模式刪除、更新,以增加模式的代表性、自學習能力、降低模式庫規模、提高檢測速度和準確度。?
如針對圖2,可能會發生如下誤分情況:①B類數據被誤分入A類數據;②A類數據中包含B類數據;③A類數據被誤分入B類;④B類數據中包含A類數據;⑤A類數據被誤分入C類;⑥C類數據中包含A類數據;⑦C類數據被誤分入A類;⑧A類數據中包含C類數據。?
因此,對相關難點問題進行進一步的分析和緩解具有重要意義。?
發明內容
為了克服背景技術中的不足,提出一種基于相互約束的模糊數據分類方法,用于提高模糊分類算法的泛化分類能力,解決數據分布較復雜情況下異類樣本所形成集合的重疊、較大拐點以及數據合并的問題,提高模糊分類算法的準確性、適應性和自學習能力。?
為解決上述技術問題,本發明提供了如下技術方案:?
一種基于相互約束的模糊數據分類方法,該算法至少包括以下的步驟:?
1)錄入帶有分類標識的數據集,并給出模式合并閾值λi;?
2)針對每類數據集,分別利用基于彈性約束的四點中心邊界方法EFCBA挖掘模式規則,最終建立模式庫;?
3)進行未知類型數據的類型檢測,根據基于約束的類別歸屬算法EDCA進行數據分類,給出分類標識信息;?
4)針對分類結果,使用自學習調節模型進行模式庫模式更新;針對需要模式合并的模式,給出合并建議,由用戶進行結果的認定,若接受結果則進入步驟5;否則進入步驟6;?
5)更新模式庫,并針對合并規則標識子分類信息,進行類別層級的劃分和標識;?
6)完成模式庫模式類別的標識,給出最終結果信息。?
優選的是,所述基于彈性約束的模糊分類算法是基于虛擬數字實體化觀點來思考模式庫的建立、數據的分類和模式更新。?
優選的是,所述在進行模式規則挖掘時,通過五元組{A、B、C、D、Differences}來表示類別模式。?
優選的是,所述五元組{A、B、C、D、Differences}通過基于彈性理論的4點中心邊界算法EFCBA(Elasticity?based?four-point?center?and?border?line?algorithm?illustration)進行獲取。?
優選的是,當進行類型檢測時,檢測過程是利用模式庫中挖掘的模式記錄來約束給定記錄,判斷相互之間的差異程度,給出相互間的比較等級step、等級相似程度simulation和是否為該類的類別標識ismember(O是,1否)。?
在完成類別檢測后,結果集合ArryRes{kind,ismember,step,simulation}表明?了未知數據對每個現有數據類的相似性,通過基于約束的類別歸屬算法EDCA進行最終類別的判定。?
優選的是,所述比較等級step指記錄與給定聚集相互比較所達到的層次,根據虛擬數字實體化觀點,把比較等級分為5級;所述等級相似程度simulation指在當前比較等級下,記錄與給定類別間的相似程度,用距離比來表示等級相似程度,不同等級距離的取值方法也有所不同,根據虛擬數字實體化觀點各級等級相似程度進行求解;?
所述相似程度指某個記錄與給定類別相似的程度,通過比較等級和等級相似程度來表示。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西大學,未經廣西大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310715125.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:單向減速帶
- 下一篇:一種家庭報警油水分離器





