[發明專利]一種數據分類回歸方法及裝置有效
| 申請號: | 201410242170.0 | 申請日: | 2014-05-30 |
| 公開(公告)號: | CN105138527B | 公開(公告)日: | 2019-02-12 |
| 發明(設計)人: | 田光見;張夏天;范偉 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 分類 回歸 方法 裝置 | ||
本發明公開了一種數據分類回歸方法及裝置。方法為,將初始樣本向量集合劃分為連續類型數據序列、類別類型數據序列,以及二進制數據序列,并將連續類型數據序列、類別類型數據序列分別轉化為二進制形式的第一向量序列以及第二向量序列,合并第一向量序列、第二向量序列,以及二進制數據序列,生成分類回歸向量序列;根據該分類回歸向量序列中的每一個向量,獲取初始樣本向量集合的分類回歸結果。采用本發明技術方案,數據分類回歸結果的獲取不受數據維數以及數據數量的限制,并且無須采用迭代算法實現數據的分類回歸,從而降低了獲取數據分類回歸結果的復雜度。
技術領域
本發明涉及數據處理領域,尤其涉及一種數據分類回歸方法及裝置。
背景技術
在數據處理領域,對數據進行分類回歸即為,從針對已知類別訓練集合的分析結果中發現分類規則,以此預測新采集數據的類別。通過對采集到的數據進行回歸分析,可以從中獲取用戶需要的分類信息,以及根據該分類信息獲取更深層次的規律,從而將該規律應用于銀行風險評估、客戶類別分類、文本檢索和搜索引擎分類、安全領域中的入侵檢測應用等相關領域。
目前,對數據進行分類回歸的方法有多種,如神經網絡,貝葉斯網絡等方法,采用上述方法能夠快速實現數據的分類回歸。但是,由于上述方法在算法上的局限性,當數據的空間維數很高(即類型較多)時,對數據進行分類回歸后所得到結果精度將迅速下降甚至無法得出分類回歸結果。
針對上述技術問題,通常采用核方法來解決高維數據的分類回歸問題,例如采用SVM(Support Vector Machine;支持向量機)模型實現對高維數據的分類回歸。由于SVM模型實現數據分類回歸時,需要進行大量的迭代運算,若所采集的數據數量較為龐大,則需要較大的計算開銷來獲取數據分類回歸的結果,因此,上述SVM模型僅適用于對數量較小的數據進行分類回歸的應用場景。
由此可見,目前在對數據進行分類回歸時,存在計算復雜度隨著數據規模,數據維數的增長而增長太快,甚至無法求解的問題。
發明內容
本發明實施例提供一種數據分類回歸方法及裝置,用以解決目前在對數據進行分類回歸時,存在計算復雜度高的問題。
本發明實施例提供的具體技術方案如下:
第一方面,提供一種數據分類回歸方法,包括:
接收初始樣本向量集合,并根據所述初始樣本向量集合中每一個樣本向量包含的數據類型,對所述初始樣本向量集合進行劃分,獲取連續類型數據序列,類別類型數據序列,以及二進制數據序列;其中,所述初始樣本向量集合中包含至少一個樣本向量,所述樣本向量包含樣本對應的屬性信息;所述連續類型數據序列用于表征所述屬性信息中數字類型的屬性信息;所述類別類型數據序列用于表征所述屬性信息中非數字類型的屬性信息;
根據所述連續類型數據序列,生成二進制形式的第一向量序列;
根據所述類別類型數據序列,生成二進制形式的第二向量序列;
將所述第一向量序列、第二向量序列,以及所述二進制數據序列進行合并后,生成分類回歸向量序列;其中,所述分類回歸向量序列中包含多個向量;
分別根據所述分類回歸向量序列中的每一個向量,獲取所述初始樣本向量集合對應的各個類別回歸哈希桶,并分別計算所述各個類別回歸哈希桶對應的類別統計值,以及根據所述類別統計值獲取所述初始樣本向量集合的分類回歸結果;其中,所述類別回歸哈希桶中包含相應類別的樣本數目。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410242170.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種堅果香菇粉及其制備方法
- 下一篇:一種天然香菇精提取物微膠囊的制備方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





