[發明專利]一種基于分解的多目標進化模糊規則分類方法有效
| 申請號: | 201510240068.1 | 申請日: | 2015-05-12 |
| 公開(公告)號: | CN104809476B | 公開(公告)日: | 2018-07-31 |
| 發明(設計)人: | 劉若辰;焦李成;宋曉林;馬晨琳;于昕;王爽;馬晶晶;劉紅英 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/12 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 程曉霞;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分解 多目標 進化 模糊 規則 分類 方法 | ||
本發明公開了一種基于分解的多目標進化模糊規則分類方法,主要解決現有的分類方法對不平衡數據分類效果差的問題。實現步驟是:獲取訓練數據集和測試數據集;歸一化并將訓練數據集分為多數類和少數類;初始化忽略概率、模糊分區數以及隸屬度函數;初始化原始種群,采用具有加權因子的模糊規則權重公式確定權重;確定迭代終止條件、迭代次數及步長、理想點;依種群劃分方向向量;原始種群執行進化操作并采用切比雪夫更新方式對原始種群更新;直至迭代終止條件;獲得測試數據集的分類結果;再投射得到AUCH并輸出。本發明運行速度快,分類效果好。能夠應用于腫瘤檢測、誤差檢測、信用卡欺詐檢測、垃圾短信識別等技術領域。
技術領域
本發明屬于數據挖掘中的分類技術領域,特別涉及一種在不平衡數據分類領域采用進化算法對模糊分類器進行優化的方法。具體是一種基于分解的多目標進化模糊規則分類方法。主要用于生物醫學識別、腫瘤檢測、信用卡欺詐檢測、垃圾短信識別等領域中存在的不平衡數據的分類。
背景技術
隨著科技的不斷進步,數據挖掘技術越來越廣泛的應用于我們的生產生活中,而作為數據挖掘領域的一個重要的分支,分類技術也越來越受到人們的重視。分類技術是指利用已知類別的數據訓練分類模型,然后用此分類模型對未知數據進行類別預測的技術。常見的應用如:語音識別、圖像識別、生物醫學識別、腫瘤檢測、信用卡欺詐檢測、垃圾短信識別等都是應用分類技術的例子,可見分類技術與我們的工作和生活息息相關,它能提高我們的工作效率和生活質量,給我們的生活帶來極大地便利。而現實生活中大部分的分類問題又都屬于不平衡分類問題,不平衡分類問題是指待分類的兩類中某一類(多數類)的數據規模遠遠大于另一類(少數類)的數據規模,例如上面提到的生物醫學識別、腫瘤檢測、信用卡欺詐檢測、垃圾短信識別。由于不平衡分類問題特有的不平衡結構,使得常規的分類技術如決策樹C4.5等更偏向于將未知數據預測為多數類而降低識別精度。
近年來基于模糊規則的模糊分類技術被應用于生物醫學檢測、腫瘤檢測、信用卡欺詐檢測、垃圾短信識別等不平衡問題分類領域并取得了較好的效果。但由于不平衡問題中多數類數據集所包含的數據與少數類數據集所包含的數據在數量上的不平衡性,導致模糊分類技術的識別精度很難提高;并且由于不平衡問題的特殊性,評價分類結果的指標也由單標準(分類精度)變成了多標準(特異度FPR、靈敏度TPR),若用單個模糊分類器對不平衡問題進行類別預測,就會導致對分類結果的評價不全面的問題。而多目標進化算法是一種基于種群的迭代優化算法,通過對分類器的多次進化迭代可以提高分類器的識別精度;并且該算法針對多標準情況能夠同時優化多個模糊分類器,有效彌補了單個模糊分類器對分類結果的評價不全面的缺點。但由于多目標進化算法較為復雜,需要多次迭代優化,使得算法運行時間較長,導致現有分類方法在處理腫瘤檢測、誤差檢測、信用卡欺詐檢測、垃圾短信識別等不平衡問題時不能兼顧較高的識別精度與較快的運行速度。數據分類過程中由于算法復雜、運行速度慢,直接影響了數據分類的效率和限制了分類算法的廣泛應用。
發明內容
本發明的目的是針對生物醫學識別、腫瘤檢測、信用卡欺詐檢測、垃圾短信識別存在數據不平衡現象的應用中少數類不易被識別的問題,提出了一種識別精度高、運行速度快的基于分解的多目標進化模糊規則分類方法。
本發明是一種基于分解的多目標進化模糊規則分類方法,其特征在于,數據分類過程包括有如下步驟:
步驟1.從某一技術領域中采集或獲取被測訓練數據集X和測試數據集X′,訓練數據集用來訓練分類器,測試數據集用來檢測訓練好的分類器的性能,兩個數據集所包含的數據具有相同的數據格式,其數據格式為xi=[xi,1,...,xi,n,y],xi為任一數據集中的第i條數據,其中xi,1,...,xi,n為數據xi的n個屬性值,y為數據xi所屬類別的類標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510240068.1/2.html,轉載請聲明來源鉆瓜專利網。





