[發明專利]主成分分析模型的獲取方法、裝置和電子設備在審
| 申請號: | 202210191291.1 | 申請日: | 2022-02-28 |
| 公開(公告)號: | CN114638287A | 公開(公告)日: | 2022-06-17 |
| 發明(設計)人: | 沈力;黃新建;陶大程 | 申請(專利權)人: | 京東科技信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q10/04 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 賀財俊;劉芳 |
| 地址: | 100176 北京市北京經濟技*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 成分 分析 模型 獲取 方法 裝置 電子設備 | ||
本申請提供了一種主成分分析模型的獲取方法、裝置和電子設備,在獲取主成分分析模型時,可以先根據多個樣本數據,確定初始主成分分析模型中的模型參數在當前迭代點的迭代方向,對當前迭代點的迭代方向進行轉換,得到當前迭代點的黎曼梯度;再根據當前迭代點的黎曼梯度,確定主成分分析模型。這樣通過將歐式框架下的迭代方向轉換為黎曼梯度,并在黎曼框架下確定新的迭代點,使得可以充分利用正交約束的幾何信息,得到主成分分析模型,從而有效地提高了主成分分析模型的獲取效率。
技術領域
本申請涉及數據處理技術領域,尤其涉及一種主成分分析模型的獲取方法、裝置和電子設備。
背景技術
主成分分析(Principal Component Analysis,PCA)方法是目前機器學習、數據科學等領域應用廣泛一種數據分析方法。主要用于對高維數據進行降維處理,以提取數據的特征分量。
在通過主成分分析模型對高維數據降維處理時,需要先獲取主成分分析模型。相關技術中,在獲取主成分分析模型時,主要是基于歐式空間的算法,例如近端算法、置信域法、擬牛頓法。但是,基于歐式空間的算法,會主成分分析模型的獲取效率較低。
發明內容
本申請實施例提供了一種主成分分析模型的獲取方法、裝置和電子設備,提高了主成分分析模型的獲取效率。
第一方面,本申請實施例提供了一種主成分分析模型的獲取方法,該主成分分析模型的獲取方法可以包括:
S1:根據多個樣本數據,確定初始主成分分析模型中的模型參數在當前迭代點的迭代方向。
S2:對所述當前迭代點的迭代方向進行轉換,得到所述當前迭代點的黎曼梯度。
S3:根據所述當前迭代點的黎曼梯度,確定主成分分析模型。
在一種可能的實現方式中,所述根據所述當前迭代點的黎曼梯度,確定主成分分析模型,包括:
S4:基于所述當前迭代點的切空間和所述當前迭代點的黎曼梯度,確定下一個迭代點,并將所述下一個迭代點作為新的當前迭代點。
重復執行上述S2和S4,直至滿足停止條件,并將最后一次得到的迭代點確定為所述初始主成分分析模型的模型參數,得到主成分分析模型。
在一種可能的實現方式中,所述基于所述當前迭代點的切空間和所述當前迭代點的黎曼梯度,確定下一個迭代點,包括:
在所述當前迭代點的切空間中,基于預設步長在負黎曼梯度的負方向上確定目標點。
對所述目標點執行拉回操作,得到所述下一個迭代點。
在一種可能的實現方式中,所述對所述當前迭代點的迭代方向進行轉換,得到所述當前迭代點的黎曼梯度,包括:
獲取線性算子。
基于所述線性算子對所述當前迭代點的迭代方向進行轉換,得到所述當前迭代點的黎曼梯度。
在一種可能的實現方式中,其中,所述當前迭代點為首個迭代點,所述多個樣本數據包括第一樣本數據;所述根據多個樣本數據,確定初始主成分分析模型中的模型參數在當前迭代點的迭代方向,包括:
根據所述第一樣本數據,對所述初始主成分分析模型中的模型參數進行初始化,得到所述模型參數在所述當前迭代點的迭代方向。
在一種可能的實現方式中,其中,所述當前迭代點為非首個迭代點,所述多個樣本數據包括第一樣本數據和第二樣本數據;所述根據多個樣本數據,確定初始主成分分析模型中的模型參數在當前迭代點的迭代方向,包括:
根據所述第一樣本數據、所述第二樣本數據及預設概率,確定所述模型參數在所述當前迭代點的迭代方向;其中,所述預設概率用于表征所述第一樣本數據和所述第二樣本數據的配比。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東科技信息技術有限公司,未經京東科技信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210191291.1/2.html,轉載請聲明來源鉆瓜專利網。





