[發明專利]一種不完備數據集快速屬性約簡方法在審
| 申請號: | 201811574927.0 | 申請日: | 2018-12-21 |
| 公開(公告)號: | CN109828996A | 公開(公告)日: | 2019-05-31 |
| 發明(設計)人: | 閆濤;韓崇昭 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 徐文權 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 屬性約簡 數據集 算法 大規模數據集 時間復雜度 分辨能力 特征屬性 改進 | ||
1.一種不完備數據集快速屬性約簡方法,其特征在于,基于正近似集的方法包括以下步驟:
步驟一,輸入不完備決策表S=(U,C∪D),U為全空間,C為條件屬性全集,D為決策屬性;
步驟二,將red初始化為空集即其中,red為已選擇的條件屬性集合;
步驟三,計算Siginner(ak,C,D,U),其中k≤|C|,ak為第k個條件屬性,Siginner()為條件屬性全集C中所含的第k個條件屬性ak的屬性重要性;
步驟四,將ak加入到red之中,其中Siginner(ak,C,D,U)>0;
步驟五,使i←1,R1=red,P1={R1},U1←U;
步驟六,判斷和是否成立,為目標對象子集U1的評價函數;
若都成立,則循環尋找并添加red之外的部分所含具有最大屬性重要性的條件屬性至red中,直至滿足
若有一條不成立,則轉至步驟七;
步驟七,Ri←Ri∪{a0},Pi←{R1,R2,...,Ri};
步驟八,返回條件屬性約簡結果red并結束。
2.根據權利要求1所述的一種不完備數據集快速屬性約簡方法,其特征在于,步驟六的具體方法如下:
第一步,計算正近似集中的正區域
第二步,
第三步,i←i+1;
第四步,red←red∪{a0},其中,Sigouter(a0,red,D,Ui)=max{Sigouter(ak,red,D,Ui)},ak∈C-red;
第五步,判斷和是否成立:
若都成立,則轉至第一步;否則,跳出循環結束步驟六,進行步驟七。
3.根據權利要求1所述的一種不完備數據集快速屬性約簡方法,其特征在于,步驟一中,不完備決策表的快速容許類獲取算法的復雜度為其中,表示條件屬性ak之下具有缺失屬性值*的所有對象的數量,而則表示條件屬性ak之下具有非缺失屬性值,即屬性值不為*的所有對象的數量。
4.一種不完備數據集快速屬性約簡方法,其特征在于,基于變精度正近似集的方法包括以下步驟:
步驟一:輸入不完備決策表S=(U,C∪D)以及閾值β≤0.5;
步驟二:將red初始化為空集即其中,red為已選擇的條件屬性集合;
步驟三:計算其中k≤|C|;
步驟四:將ak加入到red之中,其中
步驟五:i←1,R1=red,P1={R1},U1←U;
步驟六:判斷和是否成立:
若都成立,則循環尋找并添加red之外的部分所含具有最大屬性重要性的條件屬性至red中,直至滿足
若有一條不成立,則轉至步驟七;
步驟七:Ri←Ri∪{a0},Pi←{R1,R2,..,Ri};
步驟八:返回條件屬性約簡結果red并結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811574927.0/1.html,轉載請聲明來源鉆瓜專利網。





