[發明專利]優化樣本向量的方法及裝置、計算機設備在審
| 申請號: | 201710541204.X | 申請日: | 2017-07-05 |
| 公開(公告)號: | CN107451662A | 公開(公告)日: | 2017-12-08 |
| 發明(設計)人: | 張志強;周俊;李小龍 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06N99/00 | 分類號: | G06N99/00 |
| 代理公司: | 北京博思佳知識產權代理有限公司11415 | 代理人: | 林祥 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 優化 樣本 向量 方法 裝置 計算機 設備 | ||
技術領域
本申請涉及機器學習技術領域,尤其涉及一種優化樣本向量的方法及裝置、計算機設備。
背景技術
目前,機器學習(Machine Learning,ML)已經被應用于諸多領域,例如,人工智能(Artificial Intelligence,AI)。機器學習任務通常是基于樣本數據來進行的,每個樣本對應于包含至少一個特征的特征列表。對于每一樣本而言,其所對應的特征列表中的若干特征之間往往存在一定的非線性關系,在當今的很多機器學習任務中,若能夠捕捉到特征間的非線性關系并將其應用到機器學習中,可以有效提高機器學習的效果。目前還無法對特征間的非線性關系進行捕捉。
發明內容
有鑒于此,本申請提供一種優化樣本向量的方法及裝置、計算機設備。
為實現上述目的,本申請提供的技術方案如下:
一種優化樣本向量的方法,包括:
獲取樣本數據,所述樣本數據包括若干與樣本對應的樣本向量以及若干與樣本特征對應的特征向量,其中每一樣本對應于至少一個樣本特征;
對于任一待優化樣本,利用目標函數,優化與所述待優化樣本對應的樣本向量及與所述待優化樣本的樣本特征對應的特征向量,獲得優化后所得的樣本向量以及特征向量;其中所述目標函數的輸出值用以表征所述待優化樣本和該待優化樣本對應的至少一個樣本特征之間的關聯度,優化后的樣本向量和特征向量使得所述關聯度達到優化條件。
一種優化樣本向量的裝置,包括:
數據獲取單元,獲取樣本數據,所述樣本數據包括若干與樣本對應的樣本向量以及若干與樣本特征對應的特征向量,其中每一樣本對應于至少一個樣本特征;
數據優化單元,對于任一待優化樣本,利用目標函數,優化與所述待優化樣本對應的樣本向量及與所述待優化樣本的樣本特征對應的特征向量,獲得優化后所得的樣本向量以及特征向量;其中所述目標函數的輸出值用以表征所述待優化樣本和該待優化樣本對應的至少一個樣本特征之間的關聯度,優化后的樣本向量和特征向量使得所述關聯度達到優化條件。
一種計算機設備,包括:
處理器;
用于存儲處理器可執行指令的存儲器;
所述處理器被配置為:
獲取樣本數據,所述樣本數據包括若干與樣本對應的樣本向量以及若干與樣本特征對應的特征向量,其中每一樣本對應于至少一個樣本特征;
對于任一待優化樣本,利用目標函數,優化與所述待優化樣本對應的樣本向量及與所述待優化樣本的樣本特征對應的特征向量,獲得優化后所得的樣本向量以及特征向量;其中所述目標函數的輸出值用以表征所述待優化樣本和該待優化樣本對應的至少一個樣本特征之間的關聯度,優化后的樣本向量和特征向量使得所述關聯度達到優化條件。
通過以上技術方案可以看出,在獲取樣本數據后,對于任一待優化樣本,可以優化與所述待優化樣本對應的樣本向量及與所述待優化樣本的樣本特征對應的特征向量,得到優化后的樣本向量及特征向量。其中,優化的目的為將樣本特征間的非線性關系體現在優化后所得的樣本向量或特征向量中,最終,可將優化所得的向量應用于各類機器學習任務中,以提升機器學習的效果。
附圖說明
圖1為根據一示例性實施例示出的一種優化樣本向量的方法的流程;
圖2示出了樣本和樣本特征間的關系;
圖3為根據一示例性實施例示出的另一種優化樣本向量的方法的過程;
圖4為根據一示例性實施例示出的一種優化樣本向量的裝置的框圖。
具體實施方式
在相關技術出現的監督學習方法中,輸入數據一般可以包括一個二維的數據矩陣(每行代表一個訓練樣本,每列代表一個特征)以及一個一維的向量(表示每個樣本對應的標簽)。在相關技術中,一些線性模型可以捕捉到輸入特征與標簽之間的線性關系,如邏輯回歸(Logistic Regression)模型。但是,對于非線性模型,目前還沒有辦法捕捉特征間的非線性關系并應用到機器學習任務中,以至于無法使得機器學習的效果達到更佳。為此,本文提出了一種優化樣本向量的方案,來獲得特征間的非線性關系,以用于機器學習(Machine Learning,ML)中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710541204.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種柱模加工裝置
- 下一篇:一種廢舊電能表自動拆上表蓋系統





