[發明專利]基于模糊粗糙集條件熵屬性約簡的數據分析方法在審
| 申請號: | 201310616310.1 | 申請日: | 2013-11-27 |
| 公開(公告)號: | CN103632051A | 公開(公告)日: | 2014-03-12 |
| 發明(設計)人: | 賈海濤;張偉;唐建楊;莫祖忠;楊鋒 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 成都宏順專利代理事務所(普通合伙) 51227 | 代理人: | 周永宏 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模糊 粗糙 條件 屬性 數據 分析 方法 | ||
1.一種基于模糊粗糙集條件熵屬性約簡的數據分析方法,其特征在于:包括以下步驟:
S1:將數據的屬性構造為一個模糊粗糙集,同時確定數據的模糊決策表其中U是論域,A是由對象的基本屬性構成的集合,C為條件屬性,D為決策屬性,V代表信息函數f的值域;
S2:取一個集合T,并規定它為空集,令這個集合T的最優依賴函數Hbest為0,A的個數i=1;
S3:在每一次判斷時,都使得集合T為前一次執行時符合條件的集合T,并使得期望的依賴函數Hpre為最優依賴函數值Hbest;
S4:對于每一個其中R是等價關系的集合,計算獲得決策屬性D和屬性的條件熵并判斷它與條件熵H(D|T)的大小關系;如果前者小于后者,那么就令集合T為新的集合如果前者大于后者,那么就需要尋找新的更加符合條件的屬性集合;
S5:當判斷是否為新的數據屬性集合時,要判斷i個子集A是否已經全部覆蓋了集合C-R,如果還沒有覆蓋完全,即i<基數|C-R|,則讓i=i+1,同時重復S4;如果此時i為C-R的基數|C-R|,則進行S6;
S6:當i為C-R的基數|C-R|后,令最優依賴函數Hbest為條件熵H(D|T);
S7:比較期望的依賴函數Hpre與最優依賴函數Hbest的差值是否在規定的誤差閾值η范圍之內,如果在規定的范圍之內則輸出約簡結果;如果不在規定的范圍之內則返回S3重新進行約簡。
2.根據權利要求1所述的方法,其特征在于:S1具體步驟如下:輸入數據屬性模糊決策表
其中,四元組(U,A,V,f)表示一個信息系統,
U:U={x1,x2,…xn}為論域,由所要研究的對象構成,且
A:A={αj|αj∈A}是由對象的基本屬性構成的集合;
V:V=∪Vj(1≤j≤m)代表信息函數f的值域,Vj為屬性αj的值域;
f:f={fj|fj:U→Vj}是信息系統的信息函數,為對象xi賦予相應的值。
3.根據權利要求2所述的方法,其特征在于,S1具體還包括:對于一個決策系統DT=(U,C∪D,V,f),C為條件屬性,D為決策屬性,則定義
γP(Q)=k=|posP(Q)|/|U|???????(1)
為屬性Q依賴于屬性P的程度;其中為屬性Q的P正域,所述的正域所包含的對象是指被劃分到Q的等價類中去的P的等價類里的對象;|U|表示集合U的基數。
4.根據權利要求3所述的方法,其特征在于:S2具體如下:重新定義數據的模糊屬性和劃分論域U結果為為了與原定義的模糊等價類集合X1,X2,…,Xn進行區分,將原集合定義為同理根據模糊粗糙集中引入的模糊集隸屬度函數,對于xk∈U,它屬于模糊等價類的隸屬度也可以表示為屬于該等價類的概率,那么出現的概率就可以通過各對象的隸屬度決定,也就是
同理可以得到
為了推導聯合概率的表達式,得到集合{P,Q}劃分論域U的結果,即
其中,1≤r≤n,1≤t≤m;通過隸屬度,聯合概率可以改寫為
其中,
由于每個對象只以0或者1屬于Q的等價類所以根據式(6),可把聯合概率改寫為
那么,Q相對P的條件熵可以變為:
依賴函數是條件熵的值,從而得到了依賴函數,在此基礎上進行屬性約簡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310616310.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:經椎板的棘突間穩定系統
- 下一篇:一種臥式銑床的立臥轉換夾具
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





