[發明專利]非平衡類數據的分類在審
| 申請號: | 201410100293.0 | 申請日: | 2014-03-18 |
| 公開(公告)號: | CN104933053A | 公開(公告)日: | 2015-09-23 |
| 發明(設計)人: | 楊鴻超;趙金濤;邱雪濤;王駿 | 申請(專利權)人: | 中國銀聯股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 李湘;湯春龍 |
| 地址: | 200135 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 平衡 數據 分類 | ||
1.一種訓練非平衡類數據分類器的方法,由所述非平衡類數據分類器進行分類的數據具有多個屬性,其特征在于,所述方法包含下列步驟:
將所述多個屬性劃分為多個屬性組,每個所述屬性組對應一個子分類器,每個所述子分類器適于基于對應的所述屬性組對數據進行分類,使得能夠根據預先設定的規則,由各個所述子分類器的分類結果得到最終的分類結果;
將訓練數據樣本劃分為多個測試集;以及
對于每個所述屬性組,利用不同的所述測試集訓練對應的子分類器。
2.如權利要求1所述的方法,其中,將所述多個屬性劃分為n個屬性組并且將訓練數據樣本劃分為(n+1)個測試集,在子分類器的訓練步驟中,按照下列方式訓練第i個子分類器:
利用前(i-1)個子分類器對第i個測試集的訓練數據樣本進行分類以得到(i-1)組正類數據;
將所述(i-1)組正類數據的交集作為進一步的訓練數據樣本來訓練第i個子分類器。
3.如權利要求1所述的方法,其中,按照隨機方式將訓練數據樣本劃分為多個測試集。
4.如權利要求2所述的方法,其中,利用最大召回率算法來訓練第i個子分類器。
5.如權利要求1所述的方法,其中,按照屬性之間的相關性將所述多個屬性劃分為多個屬性組,所述相關性較大的屬性被劃分在不同的屬性組內。
6.一種非平衡類數據分類器,其特征在于,包括:
數據接收單元;
多個子分類器,由所述非平衡類數據分類器進行分類的數據具有多個屬性,所述多個屬性被劃分為多個屬性組,每個所述屬性組對應一個所述子分類器,每個所述子分類器被配置為獨立地從所述數據接收單元接收數據并且基于對應的所述屬性組對接收的數據進行分類;以及
與所述多個子分類器耦合的決策節點,其配置為根據預先設定的規則,由各個所述子分類器輸出的分類結果得到最終的分類結果,
其中,按照下列方式訓練所述非平衡類數據分類器:將訓練數據樣本劃分為多個測試集,對于每個所述屬性組,利用不同的所述測試集訓練對應的子分類器。
7.如權利要求6所述的非平衡類數據分類器,其中,所述多個子分類器和所述決策節點在多個物理上獨立的計算設備上實現。
8.如權利要求6所述的非平衡類數據分類器,其中,將所述多個屬性劃分為n個屬性組并且將訓練數據樣本劃分為(n+1)個測試集,按照下列方式訓練第i個子分類器:
利用前(i-1)個子分類器對第i個測試集的訓練數據樣本進行分類以得到(i-1)組正類數據;
將所述(i-1)組正類數據的交集作為進一步的訓練數據樣本來訓練第i個子分類器。
9.如權利要求6所述的非平衡類數據分類器,其中,所述決策節點取各個所述子分類器輸出的正類數據的交集作為最終的分類結果。
10.一種非平衡類數據分類的方法,包括下列步驟:
將待分類的數據輸入多個子分類器,所述待分類的數據具有多個屬性,所述多個屬性被劃分為多個屬性組,每個所述屬性組對應一個所述子分類器;
每個所述子分類器獨立地基于對應的所述屬性組對所述待分類的數據進行分類;以及
根據預先設定的規則,由各個所述子分類器輸出的分類結果得到最終的分類結果,
其中,按照下列方式訓練所述非平衡類數據分類器:將訓練數據樣本劃分為多個測試集,對于每個所述屬性組,利用不同的所述測試集訓練對應的子分類器。
11.如權利要求10所述的方法,其中,所述多個子分類器和所述決策節點在多個物理上獨立的計算設備上實現。
12.如權利要求10所述的方法,其中,將所述多個屬性劃分為n個屬性組并且將訓練數據樣本劃分為(n+1)個測試集,按照下列方式訓練第i個子分類器:
利用前(i-1)個子分類器對第i個測試集的訓練數據樣本進行分類以得到(i-1)組正類數據;
將所述(i-1)組正類數據的交集作為進一步的訓練數據樣本來訓練第i個子分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀聯股份有限公司,未經中國銀聯股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410100293.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據處理的方法和系統
- 下一篇:個人填表信息輔助翻譯方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





