[發明專利]一種離散數據集冗余特征約減的數據融合方法在審
| 申請號: | 201811072282.0 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN109447106A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 周建中;劉英;趙宇杰;杜義;劉涵;李玲;姜偉;單亞輝;李超順;田弟巍;王齊飛 | 申請(專利權)人: | 國家電網有限公司;國網新源控股有限公司;湖北白蓮河抽水蓄能有限公司;華中科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智;曹葆青 |
| 地址: | 100000 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 離散數據 數據融合 數據集 融合 分類結果 冗余特征 屬性集 粗糙集理論 數據集屬性 單獨屬性 計算分析 決策屬性 時間開銷 條件屬性 雙向的 減小 分工 應用 分析 | ||
本發明公開了一種離散數據集冗余特征約減的數據融合方法,屬于數據融合分析領域。本發明首先對數據集在各單獨屬性以及在決策屬性、條件屬性下的分類結果進行計算分析,判斷離散數據集是否具有約減融合的潛力;然后計算離散數據集的核屬性集及依據核屬性的分類結果并進行雙向的約減過程,進而得到離散數據集的最小屬性集,實現離散數據集的特征約減與融合。在特征約減融合過程中,相對于經典粗糙集理論方法,體現了高效的分工溝通機制,縮短了數據集最小約減過程的計算時間。本發明提供的這種數據集融合方法可以應用在多種類型的離散數據集屬性約減過程中,能有效減小數據集屬性約減的時間開銷。
技術領域
本發明屬于數據融合分析領域,更具體地,涉及一種離散數據集冗余特征約減的數據融合方法。
背景技術
隨著經濟和社會的快速發展,各行各業經過一定時間的累積,都擁有了規模可觀的行業數據,大數據分析已成為重要的進步手段。然而面對如此龐大的數據量,要從中找出有用的信息是十分困難的,需要運用相關的數據分析方法,在一定程度上對原有數據集進行約減融合,提升原有數據集的信息密度,對實際的生產生活提供指導。
粗糙集理論于1982年由波蘭學者Pawlak首次提出。它可以在無需任何先驗知識前提下,從一種全新的視角審視知識,通過知識約簡,獲得問題的決策或分類規則從而建立起知識與分類的聯系,達到處理不確定、不完備等數據的目的。傳統的粗糙集理論在數據融合中的應用受到其計算速度的限制:其約減方式是沿著屬性個數由多到少的方向進行的,且一般都不考慮重要的核屬性的限制,使得需要遍歷的屬性組合數目過多,計算的能力又相對不足,從而使得計算時長常常無法忍受。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種離散數據集冗余特征約減的數據融合方法,由此解決現有技術存在的計算能力不足,計算時間過長的技術問題。
為實現上述目的,本發明的一個方面,提供了一種離散數據集冗余特征約減的數據融合方法,包括:
(1)對待融合的離散數據集按照屬性集中的每個屬性進行分類,得到分類結果S;
(2)所述屬性集包括條件屬性集和決策屬性集,根據分類結果S,計算按照條件屬性集進行分類的第一分類結果U/C和按照決策屬性集進行分類的第二分類結果U/D;
(3)當第一分類結果U/C對第二分類結果U/D的上下近似相同時,計算第一分類結果U/C依次去除條件屬性集中的一個條件屬性后的第三分類結果,當第三分類結果不能實現對第二分類結果U/D的完整描述時,將第三分類結果對應的去除的條件屬性作為核屬性集core,根據核屬性集core得到核屬性分類結果core_set,當第三分類結果能實現對第二分類結果U/D的完整描述時,將第三分類結果對應的去除的條件屬性作為非核屬性集;
(4)計算核屬性分類結果core_set對第二分類結果U/D的上下近似是否相同,若相同則待融合的離散數據集的最小屬性集RED=core,否則進入步驟(5);
(5)若非核屬性集中非核條件屬性的個數小于2,則待融合的離散數據集的最小屬性集RED為條件屬性集,否則同時對非核屬性集進行正向約減與逆向約減,得到最終的待融合的離散數據集的最小屬性集RED。
進一步地,步驟(3)還包括:
當第一分類結果U/C對第二分類結果U/D的上下近似不相同時,待融合的離散數據集的最小屬性集RED為空集。
進一步地,步驟(5)中同時對非核屬性集進行正向約減與逆向約減的具體實現方式包括:
(5-1)設置正、逆向約減停止標志以及相鄰位置標志f_stop、r_stop和near_flag為0;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網有限公司;國網新源控股有限公司;湖北白蓮河抽水蓄能有限公司;華中科技大學,未經國家電網有限公司;國網新源控股有限公司;湖北白蓮河抽水蓄能有限公司;華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811072282.0/2.html,轉載請聲明來源鉆瓜專利網。





