[發明專利]一種多維數據處理方法、裝置、計算機設備及存儲介質在審
| 申請號: | 201910472215.6 | 申請日: | 2019-05-31 |
| 公開(公告)號: | CN112016581A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 盛捷來;季紡紡 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 李昂;張穎玲 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多維 數據處理 方法 裝置 計算機 設備 存儲 介質 | ||
本發明公開了一種多維數據處理方法、裝置、計算機設備及存儲介質,所述方法包括:獲取待處理數據,所述待處理數據為具有多類別屬性的多維數據;將所述待處理數據進行降維處理得到目標維度數據,根據所述目標維度數據確定所述待處理數據的類別屬性數,如此,通過降維處理可以準確的確定待處理數據的類別屬性數;進一步的,根據所述類別屬性數對所述待處理數據進行聚類分析,得到與所述類別屬性數對應的聚類中心及數據類別;根據每一所述數據類別對應的聚類中心,確定所述數據類別對應的類別屬性。
技術領域
本發明涉及物流數據處理技術領域,尤其涉及一種數據處理方法、裝置、計算機設備及存儲介質。
背景技術
隨著通信技術的發展,各種各樣的數據充斥著人們生活的各個方面,對大規模數據的分析與處理在科學研究領域占據著越來越重要的地位。數據的維數之高、結構之復雜給數據的分析與處理帶來了一定的困難。如何從高維數據中有效的找出其特征信息,是信息科學與統計科學領域中的基本問題,也是高維數據分析面臨的主要挑戰。
目前,針對高維數據的分析問題,往往需要對高維數據通過人工進行大量的預先梳理和分析,對數據的維度和類別進行預判并形成分類規則,如此不僅需要付出大量的精力,且分類結果的準確性會極大程度上依賴于分類規則的合理性,從而不僅耗費大量的人力成本,且容易導致分類結果不準確從而無法有效地應用于科學研究領域。
發明內容
有鑒于此,本發明的主要目的在于提供一種多維數據處理方法、裝置、計算機設備及存儲介質,能夠根據客觀的數據特征分析出數據類別和確定類別屬性,以實現對多維數據客觀精準分類。
為達到上述目的,本發明的技術方案是這樣實現的:
本發明實施例提供了一種多維數據處理方法,所述方法包括:
獲取待處理數據,所述待處理數據為具有多類別屬性的多維數據;
將所述待處理數據進行降維處理得到目標維度數據,根據所述目標維度數據確定所述待處理數據的類別屬性數;
根據所述類別屬性數對所述待處理數據進行聚類分析,得到與所述類別屬性數對應的聚類中心及數據類別;
根據每一所述數據類別對應的聚類中心,確定所述數據類別對應的類別屬性。
其中,所述將所述待處理數據進行降維處理得到目標維度數據,根據所述目標維度數據確定所述待處理數據的類別屬性數,包括:
將所述待處理數據進行降維得到對應的二維數據,根據所述二維數據確定所述待處理數據的類別屬性數;或,
將所述待處理數據進行降維得到對應的三維數據,根據所述三維數據確定所述待處理數據的類別屬性數。
其中,所述將所述待處理數據進行降維處理得到目標維度數據,根據所述目標維度數據確定所述待處理數據的類別屬性數,包括:
將所述待處理數據通過t-SNE算法進行降維得到目標維度數據,根據所述目標維度數據確定所述待處理數據的類別屬性數。
其中,所述將所述待處理數據通過t-SNE算法進行降維得到目標維度數據,包括:
將所述待處理數據通過高斯分布映射到高維空間得到高維數據,確定與所述高斯分布對應的第一概率分布參數;
根據所述第一概率分布參數和相對熵擬合出對應的第二概率分布參數,通過與所述第二概率分布參數對應的t分布得到與所述待處理數據對應的目標維度數據。
其中,所述根據每一所述數據類別對應的聚類中心,確定所述數據類別對應的類別屬性,包括:
確定每一所述數據類別對應的聚類中心的位置坐標;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910472215.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:飽和烴及其生產方法和用途
- 下一篇:一種新型超聚能激光手術刀





