[發明專利]一種處理缺失數據的新型決策樹分類器方法有效
| 申請號: | 201110100232.0 | 申請日: | 2011-04-21 |
| 公開(公告)號: | CN102750286A | 公開(公告)日: | 2012-10-24 |
| 發明(設計)人: | 吳軍 | 申請(專利權)人: | 常州藍城信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 蘇州廣正知識產權代理有限公司 32234 | 代理人: | 張利強 |
| 地址: | 213023 江蘇省常州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 處理 缺失 數據 新型 決策樹 分類 方法 | ||
1.一種處理缺失數據的新型決策樹分類器方法,其特征在于:包括以下步驟:
a、將待處理的原始樣本數據集進行初始化設置,且將所述數據集進行權重值初始化分配;
b、選擇一將所述數據集中的節點分裂為子節點的特征屬性;
c、將樣本數據根據節點的特征屬性分類到各子節點;
d、通過計算出各子節點選擇的特征量值將各子節點分裂出來;
e、根據分裂出來的各子節點的樣本屬性確定葉子節點。
2.根據權利要求1所述的一種處理缺失數據的新型決策樹分類器方法,其特征在于:所述數據集包括缺失數據、非缺失數據。
3.根據權利要求1所述的一種處理缺失數據的新型決策樹分類器方法,其特征在于:所述特征量值包括特征量的信息熵、特征量的信息增益率。
4.根據權利要求3所述的一種處理缺失數據的新型決策樹分類器方法,其特征在于:計算出特征量的信息增益率將子節點分裂出來時,子節點所選擇的特征量就是最大信息增益率,則繼續分裂節點為子節點;若子節點所選擇的特征量不是最大信息增益率,則重新選擇分裂為子節點的特征屬性,直至子節點所選擇的特征量為最大信息增益率。
5.根據權利要求1所述的一種處理缺失數據的新型決策樹分類器方法,其特征在于:在根據各子節點的樣本屬性確定葉子節點時,若每個子節點只含有同一類樣本,則將此節點設置為葉子節點,結束此節點的分裂;若每個子節點不只含有同一類樣本,則重新選擇分裂為子節點的特征屬性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于常州藍城信息科技有限公司,未經常州藍城信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110100232.0/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





