[發明專利]基于模糊粗糙集條件熵屬性約簡的數據分析方法在審
| 申請號: | 201310616310.1 | 申請日: | 2013-11-27 |
| 公開(公告)號: | CN103632051A | 公開(公告)日: | 2014-03-12 |
| 發明(設計)人: | 賈海濤;張偉;唐建楊;莫祖忠;楊鋒 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 成都宏順專利代理事務所(普通合伙) 51227 | 代理人: | 周永宏 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模糊 粗糙 條件 屬性 數據 分析 方法 | ||
技術領域
本發明涉及數據分析領域,具體涉及基于模糊粗糙集條件熵屬性約簡的數據分析方法。
背景技術
進入21世界以來,人們的生活水平隨科技的發展而逐步提高,越來越多的人開始關注自身的健康問題,而醫學上會根據測量得到的人體健康數據進行健康情況的判定。由于所獲得的眾多數據會出現屬性一樣、類別相同的數據,這些數據對于判斷整體健康數據來說沒有太多幫助,因此如何從眾多的數據屬性當中獲得有效的數據是本領域的重要內容。
屬性約簡是粗糙集和模糊粗糙集應用于醫學領域的重要技術。在生物醫學中,使用到模糊粗糙集的屬性約簡,可以大大提高人類健康數據分析的效率。生物醫學領域當中會根據對人體檢測獲得的健康數據進行分析,從而根據分析的結果來判定該實體的健康情況,但是一個實體的健康數據會有很多,真正有決策意義的數據卻并沒有測得的數據那樣多,這就涉及到屬性約簡的方法,采用基于模糊粗糙集條件熵屬性約簡可以對獲得的人體健康數據進行屬性歸類,從眾多數據中獲得需要的有用健康信息。
屬性約簡當中涉及到模糊粗糙集,模糊粗糙集是D.Dubios和H.Prad在1992年提出的,他們將模糊集和粗糙集結合,對粗糙集理論進行了擴展,從而得到了模糊粗糙集。模糊粗糙集相對經典粗糙集的優勢就在于引入了模糊集理論,該理論是用模糊集合及隸屬度來描述一個對象,使得模糊粗糙集不需要進行經典粗糙集的離散化過程,只需要進行的是模糊化過程,即求解對象隸屬度值的過程。相比離散化,模糊化能夠較好的保留原來健康數據連續屬性值之間的差異性及過渡性。
發明內容
本發明的目的是為了提高數據分析的效率而提出的一種基于模糊粗糙集條件熵屬性約簡的數據分析方法。
為了實現以上發明目的,本發明采取的技術方案如下:一種基于模糊粗糙集條件熵屬性約簡的數據分析方法,包括以下步驟:
S1:將數據的屬性構造為一個模糊粗糙集,同時確定數據的模糊決策表其中U是論域,A是由對象的基本屬性構成的集合,C為條件屬性,D為決策屬性,V代表信息函數f的值域;
S2:取一個集合T,并規定它為空集,令這個集合T的最優依賴函數Hbest為0,A的個數i=1;
S3:在每一次判斷時,都使得集合T為前一次執行時符合條件的集合T,并使得期望的依賴函數Hpre為最優依賴函數值Hbest;
S4:對于每一個其中R是等價關系的集合,計算獲得決策屬性D和屬性的條件熵并判斷它與條件熵H(D|T)的大小關系;如果前者小于后者,那么就令集合T為新的集合如果前者大于后者,那么就需要尋找新的更加符合條件的屬性集合;
S5:當判斷是否為新的數據屬性集合時,要判斷i個子集A是否已經全部覆蓋了集合C-R,如果還沒有覆蓋完全,即i<基數|C-R|,則讓i=i+1,同時重復S4;如果此時i為C-R的基數|C-R|,則進行S6;
S6:當i為C-R的基數|C-R|后,令最優依賴函數Hbest為條件熵H(D|T);
S7:比較期望的依賴函數Hpre與最優依賴函數Hbest的差值是否在規定的誤差閾值η范圍之內,如果在規定的范圍之內則輸出約簡結果;如果不在規定的范圍之內則返回S3重新進行約簡。
進一步的,S1具體步驟如下:輸入數據屬性模糊決策表
其中,四元組(U,A,V,f)表示一個信息系統,
U:U={x1,x2,…xn)為論域,由所要研究的對象構成,且
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310616310.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:經椎板的棘突間穩定系統
- 下一篇:一種臥式銑床的立臥轉換夾具
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





