[發明專利]一種離散數據集冗余特征約減的數據融合方法在審
| 申請號: | 201811072282.0 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN109447106A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 周建中;劉英;趙宇杰;杜義;劉涵;李玲;姜偉;單亞輝;李超順;田弟巍;王齊飛 | 申請(專利權)人: | 國家電網有限公司;國網新源控股有限公司;湖北白蓮河抽水蓄能有限公司;華中科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智;曹葆青 |
| 地址: | 100000 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 離散數據 數據融合 數據集 融合 分類結果 冗余特征 屬性集 粗糙集理論 數據集屬性 單獨屬性 計算分析 決策屬性 時間開銷 條件屬性 雙向的 減小 分工 應用 分析 | ||
1.一種離散數據集冗余特征約減的數據融合方法,其特征在于,包括:
(1)對待融合的離散數據集按照屬性集中的每個屬性進行分類,得到分類結果S;
(2)所述屬性集包括條件屬性集和決策屬性集,根據分類結果S,計算按照條件屬性集進行分類的第一分類結果U/C和按照決策屬性集進行分類的第二分類結果U/D;
(3)當第一分類結果U/C對第二分類結果U/D的上下近似相同時,計算第一分類結果U/C依次去除條件屬性集中的一個條件屬性后的第三分類結果,當第三分類結果不能實現對第二分類結果U/D的完整描述時,將第三分類結果對應的去除的條件屬性作為核屬性集core,根據核屬性集core得到核屬性分類結果core_set,當第三分類結果能實現對第二分類結果U/D的完整描述時,將第三分類結果對應的去除的條件屬性作為非核屬性集;
(4)計算核屬性分類結果core_set對第二分類結果U/D的上下近似是否相同,若相同則待融合的離散數據集的最小屬性集RED=core,否則進入步驟(5);
(5)若非核屬性集中非核條件屬性的個數小于2,則待融合的離散數據集的最小屬性集RED為條件屬性集,否則同時對非核屬性集進行正向約減與逆向約減,得到最終的待融合的離散數據集的最小屬性集RED。
2.如權利要求1所述的一種離散數據集冗余特征約減的數據融合方法,其特征在于,所述步驟(3)還包括:
當第一分類結果U/C對第二分類結果U/D的上下近似不相同時,待融合的離散數據集的最小屬性集RED為空集。
3.如權利要求1或2所述的一種離散數據集冗余特征約減的數據融合方法,其特征在于,所述步驟(5)中同時對非核屬性集進行正向約減與逆向約減的具體實現方式包括:
(5-1)設置正、逆向約減停止標志以及相鄰位置標志f_stop、r_stop和near_flag為0;
(5-2)正向約減從非核屬性集中按順序選擇第一個非核條件屬性作為第一組合開始,依次增加第一組合中非核條件屬性個數,并且記錄第一組合中非核條件屬性個數為i_f,將第一組合與核屬性集core結合后計算分類結果,而逆向約減從非核屬性集中選擇所有的非核條件屬性作為第二組合開始,依次減少第二組合中非核條件屬性個數,并且記錄剩余的非核條件屬性個數為i_r,將第二組合與核屬性集core結合后計算分類結果;
(5-3)若i_f和i_r不相鄰,相鄰位置標志near_flag保持為0不變;
(5-4)若i_f和i_r相鄰,則相鄰位置標志near_flag為1。
4.如權利要求3所述的一種離散數據集冗余特征約減的數據融合方法,其特征在于,所述步驟(5-3)包括:
(5-3-1)若i_f和i_r不相鄰,相鄰位置標志near_flag保持為0不變,對于逆向約減過程,在逆向約減停止標志r_stop不為1的情況下,若在逆向約減過程中出現能區分U/D的第二組合,則記錄當前非核條件屬性個數i_r和第二組合編號位置no_r,之后在第二組合中按順序減少一個非核條件屬性,進入i_r-1個非核條件屬性的第二組合的循環中;
(5-3-2)若逆向約減過程中發現遍歷第二組合后不能區分U/D且r_stop仍然為0,則暫停當前逆向約減過程,設置正向約減停止標志f_stop為1以停止正向約減過程;
(5-3-3)對于正向約減過程,在正向約減停止標志f_stop標志不為1的前提下,若在正向約減過程中出現能區分U/D的第一組合,則暫停當前正向約減過程,記錄當前非核條件屬性個數i_f的值以及相應的第一組合編號no_f,同時設置r_stop標志為1以停止逆向約減過程。
5.如權利要求3所述的一種離散數據集冗余特征約減的數據融合方法,其特征在于,所述步驟(5-4)包括:
(5-4-1)若i_f和i_r相鄰,則相鄰位置標志near_flag為1,對于逆向約減過程,在逆向約減過程停止標志r_stop仍為0且正向約減等待標志wait不為1的情況下,若有可區分U/D的第二組合,記錄當前的第二組合編號no_r并添加該第二組合至R_RED中,繼續進行當前的逆向約減過程直至步驟(5-2)得到的所有第二組合全部遍歷完成或者逆向約減過程停止標志r_stop標志變為1;
(5-4-2)若步驟(5-4-1)遍歷完成后R_RED非空,則逆向約減過程中判斷正向約減等待標志wait標志是否為1,當wait標志為1,將正向約減過程停止標志f_stop設置為1并且RED即為R_RED,否則當正向約減過程中出現可區分U/D的第一組合將r_stop設置為1從而停止當前的逆向約減過程;
(5-4-3)逆向約減過程中,若逆向約減過程停止標志r_stop不為1且遍歷完步驟(5-2)得到的所有第二組合后無法區分U/D,停止當前的正逆向約減過程,將正向約減過程停止標志f_stop設置為1;
(5-4-4)逆向約減過程中,若逆向約減過程停止標志r_stop不為1且正向約減等待標志wait為1,則當逆向約減過程中找到最小約減,就記錄當前的第二組合的i_r和第二組合編號no_r,并停止當前正逆向約減過程,f_stop標志置1;
(5-4-5)正向約減過程中,在正向約減過程停止標志f_stop不為1的情況下,若搜索到一個能區分U/D的第一組合,則記錄當前的第一組合位置編號,并停止當前的逆向約減過程,并將r_stop設置為1;
(5-4-6)正向約減過程中,在正向約減過程停止標志f_stop不為1的情況下,若遍歷完第一組合無法區分U/D,則應停止當前正向約減過程,置等待標志wait為1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網有限公司;國網新源控股有限公司;湖北白蓮河抽水蓄能有限公司;華中科技大學,未經國家電網有限公司;國網新源控股有限公司;湖北白蓮河抽水蓄能有限公司;華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811072282.0/1.html,轉載請聲明來源鉆瓜專利網。





