[發(fā)明專利]一種數(shù)據(jù)特征提取方法、裝置、終端設備及介質(zhì)有效
| 申請?zhí)枺?/td> | 202010083952.X | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111309850B | 公開(公告)日: | 2022-03-25 |
| 發(fā)明(設計)人: | 余曉填;楊天寶 | 申請(專利權)人: | 深圳云天勵飛技術股份有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F40/205;G06N20/00 |
| 代理公司: | 深圳中一聯(lián)合知識產(chǎn)權代理有限公司 44414 | 代理人: | 左婷蘭 |
| 地址: | 518000 廣東省深圳市龍崗區(qū)橫崗*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數(shù)據(jù) 特征 提取 方法 裝置 終端設備 介質(zhì) | ||
本申請適用于大數(shù)據(jù)處理技術領域,提供了一種數(shù)據(jù)特征提取方法、數(shù)據(jù)特征提取裝置、終端設備及介質(zhì),數(shù)據(jù)特征提取方法包括:根據(jù)樣本數(shù)據(jù)構建高維稀疏向量;基于預設函數(shù)對高維稀疏向量進行迭代求解,得到高維稀疏向量的支撐點向量;基于約束條件對支撐點向量進行約束映射,以修正支撐點向量;基于目標函數(shù)對修正后的支撐點向量進行驗證,驗證通過則將修正后的支撐點向量確定為目標特征向量,通過對高維稀疏向量進行迭代求解,能夠快速確定出該高維稀疏向量的支撐點向量,進而基于約束條件修正支撐點向量,進而實現(xiàn)對高維稀疏向量的優(yōu)化問題的求解,能夠有效地提取出高維稀疏向量中的目標特征向量,能夠有效地提高數(shù)據(jù)特征提取的效率。
技術領域
本申請屬于大數(shù)據(jù)處理技術領域,尤其涉及一種數(shù)據(jù)特征提取方法、裝置、終端設備及計算機可讀存儲介質(zhì)。
背景技術
文本特征指的是最能代表文本主旨的詞匯集合,文本特征不僅可以很好的概括文本主要內(nèi)容和主旨,而且可以降低文本處理的復雜程度。而文本特征學習包含了高維的詞庫信息,因此,根據(jù)樣本信息學習文本的特征表達就是一個高維稀疏向量的優(yōu)化問題。對于時空數(shù)據(jù)的地圖特征學習問題中,地圖數(shù)據(jù)的表達往往也是一個高維稀疏向量,根據(jù)樣本信息學習地圖的特征也是一個高維稀疏向量的優(yōu)化問題。因此,高維稀疏向量的優(yōu)化問題的求解是機器學習應用中特征提取的一個關鍵應用。
目前對高維稀疏向量的優(yōu)化算法主要有梯度下降方法和經(jīng)驗方法(例如模擬退火算法和蟻群算法等等)。然而現(xiàn)有的求解方法存在求解效率低的缺陷。且在很多高維稀疏向量的優(yōu)化問題中,求解的向量是帶有約束條件的,因此高維稀疏向量的優(yōu)化問題的求解的難度較高。可見,現(xiàn)有的特征提取過程中,存在特征提取效率較低的問題。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┝艘环N數(shù)據(jù)特征提取方法、裝置、終端設備及計算機可讀存儲介質(zhì),以解決現(xiàn)有的特征提取過程中,存在特征提取效率較低的問題。
本申請實施例的第一方面提供了一種數(shù)據(jù)特征提取方法,包括:
根據(jù)樣本數(shù)據(jù)構建高維稀疏向量;
基于預設函數(shù)對所述高維稀疏向量進行迭代求解,得到所述高維稀疏向量的支撐點向量;
基于約束條件對所述支撐點向量進行約束映射,以修正所述支撐點向量;其中,所述約束條件為單流形約束條件;
基于目標函數(shù)對修正后的支撐點向量進行驗證,若驗證通過,則將修正后的支撐點向量確定為目標特征向量。
進一步的,所述基于預設函數(shù)對所述高維稀疏向量進行迭代求解,得到所述高維稀疏向量的支撐點向量,包括:
將所述高維稀疏向量輸入所述預設函數(shù)中進行計算,以獲取預支撐點向量;
基于各預支撐點向量的屬性對各預支撐點向量的權重進行權重映射;
基于映射后的支撐點向量的權重以及支撐點向量出現(xiàn)的次數(shù)確定各個支撐點向量的向量系數(shù);
基于各個支撐點向量的向量系數(shù)及上一次迭代的求解結果確定本次迭代的支撐點向量。
進一步的,所述預設函數(shù)基于支撐函數(shù)構建。
示例性的,上述預設函數(shù)表示為:
S=sup port(Project(pt));
其中,pt為迭代算法中第t步的向量解,S為支撐點向量,而對于support函數(shù),其對應的求解即為如下子問題:
即是將第t步的向量解投影在歐式空間中,并確定使得投影的變動最小化的點,該點即為支撐點向量。
進一步的,所述基于目標函數(shù)對修正后的支撐點向量進行驗證,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳云天勵飛技術股份有限公司,未經(jīng)深圳云天勵飛技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010083952.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





