[發明專利]基于鄰域粗糙集和PCA融合的數據分類預測方法有效
| 申請號: | 201710237405.0 | 申請日: | 2017-04-12 |
| 公開(公告)號: | CN107016416B | 公開(公告)日: | 2021-02-12 |
| 發明(設計)人: | 王國胤;董建華;尚明生;嚴胡勇;王浩林;鄭志浩;史曉雨 | 申請(專利權)人: | 中國科學院重慶綠色智能技術研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 尹麗云 |
| 地址: | 400714 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 鄰域 粗糙 pca 融合 數據 分類 預測 方法 | ||
1.一種基于鄰域粗糙集和PCA融合的數據分類預測方法,其特征在于,包括:
采集水質檢測樣本數據,形成樣本數據集S;
根據樣本數據集,計算鄰域粗糙集權重向量和主成分權重向量;
通過對所述鄰域粗糙集權重向量和主成分權重向量進行融合,獲取融合后的權重向量,形成新樣本數據集S’,并對樣本數據集S中的數據進行分類和預測;
根據所述融合后的權重向量,構造新樣本數據集S’,在所述新樣本數據集S’中選擇一個子集作為支持向量機的訓練樣本集,選擇其它子集作為測試樣本集,根據支持向量機的訓練樣本集建立支持向量機模型,根據支持向量機模型進行數據等級分類和水質預測;
通過如下公式對所述鄰域粗糙集權重向量和主成分權重向量進行融合,獲取融合后的權重向量:
其中,m(Ai)為合成權重,R(Ai)為鄰域粗糙集權重向量中第i個鄰域粗糙集權重,P(Ai)為主成分權重向量中第i個主成分權重,融合后的權重向量D=m(A1),m(A2),…,m(Am),i=1,2……m。
2.根據權利要求1所述的基于鄰域粗糙集和PCA融合的數據分類預測方法,其特征在于:所述新樣本數據集S’通過如下步驟獲取:
通過條件屬性集A={A1,A2,…,Am}對樣本數據集S進行描述,確定條件屬性集A={A1,A2,…,Am}的決策屬性;
依次將條件屬性集A={A1,A2,…,Am}中的第i列所有樣本Ai與增益量m(Ai)相乘,獲取新樣本數據集S’的條件屬性集A’={A1’,A2’,…,Am’};
約簡新樣本數據集S’中增益為0的屬性列。
3.根據權利要求2所述的基于鄰域粗糙集和PCA融合的數據分類預測方法,其特征在于:通過如下公式對樣本數據集S中每條樣本數據進行評價:
其中,Fi為樣本數據S中的第i條數據的綜合評價指數,m'為樣本集約簡后的列數,S'ij為新樣本數據集S’約簡后的第i條,第j列的樣本數據;
根據Fi值對樣本數據集S中樣本數據進行優劣比較,Fi值越大,則質量越差。
4.根據權利要求1所述的基于鄰域粗糙集和PCA融合的數據分類預測方法,其特征在于:通過歸一化因子判斷鄰域粗糙集權重向量和主成分權重向量之間的沖突程度,若K≠1,則融合后的權重構成權重分配向量,如果K=1,則不存在融合后的權重向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院重慶綠色智能技術研究院,未經中國科學院重慶綠色智能技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710237405.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種防止翻車的快遞車
- 下一篇:平視顯示器





