[發明專利]一種機器學習系統的訓練方法和訓練系統在審
| 申請號: | 201610113716.1 | 申請日: | 2016-02-29 |
| 公開(公告)號: | CN107133190A | 公開(公告)日: | 2017-09-05 |
| 發明(設計)人: | 周俊 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F15/18 | 分類號: | G06F15/18 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器 學習 系統 訓練 方法 | ||
1.一種機器學習系統的訓練方法,利用多個樣本數據對機器學習系統進行訓練,其特征在于,所述訓練方法包括:
獲得多個樣本集合,每個樣本集合包括對應取樣時間段內的樣本數據;
根據每一個樣本集合對應的采樣時間段,設置該樣本集合對應的采樣率;
獲得多個根據采樣率采樣后的樣本集合;
分別確定所述多個采樣后的樣本集合的重要程度值;
利用該重要程度值修正所述多個采樣后的樣本集合中的每一個樣本數據,獲得修正后的樣本數據;
將每一個所述修正后的樣本數據輸入機器學習系統,對該機器學習系統進行訓練。
2.如權利要求1所述的機器學習系統的訓練方法,其特征在于,所述利用該重要程度值修正所述多個采樣后的樣本集合中的每一個樣本數據,獲得修正后的樣本數據的步驟包括:
將每一個所述重要程度值與對應的采樣后的樣本集合中的每一個樣本數據相乘,獲得修正后的樣本數據。
3.如權利要求1所述的機器學習系統的訓練方法,其特征在于,所述將每一個所述修正后的樣本數據輸入機器學習系統,對該機器學習系統進行訓練的步驟包括:
計算出每一個所述修正后的樣本數據的梯度;
降低每一個所述梯度的精度;
將降低精度后的梯度輸入所述機器學習系統,對該機器模型進行訓練。
4.如權利要求3所述的機器學習系統的訓練方法,其特征在于,所述降低每一個所述梯度的精度的步驟包括:
利用下述公式,減少每一個梯度的存儲字節,以實現降低精度:
X1=floor(c*X+(rand())/d)/c
其中floor為向下取整;rand()為產生0-d之間的浮點數;X1為減少 后的存儲字節數;X為減少前的存儲字節數。
5.如權利要求1所述的機器學習系統的訓練方法,其特征在于,所述分別確定所述多個采樣后的樣本集合的重要程度值步驟包括:
基于對應的采樣率對所述采樣后的樣本集合的初始重要程度值進行修正,得到所述采樣后的樣本集合的重要程度值;
所述重要程度值和初始重要程度值為正比關系,和所述采樣后的樣本集合的采樣率為反比關系。
6.如權利要求5所述的機器學習系統的訓練方法,其特征在于,所述分別設置所述多個采樣后的樣本集合的重要程度值步驟還包括:
按照預置規則,提高最新的取樣時間段對應的樣本集合的重要程度值。
7.如權利要求6所述的機器學習系統的訓練方法,其特征在于,所述預置規則包括:
提高后的最新的取樣時間段對應的樣本集合的重要程度值與提高前的最新的取樣時間段對應的樣本集合的重要程度值成正比,并與樣本集合的總個數成正比。
8.如權利要求1所述的機器學習系統的訓練方法,其特征在于,在根據每一個樣本集合對應的采樣時間段,設置該樣本集合對應的采樣率的步驟中,所述樣本集合的采樣率隨著該樣本集合對應的取樣時間段從舊到新而增加。
9.一種機器學習系統的訓練系統,利用多個樣本數據對機器學習系統進行訓練,其特征在于,所述訓練系統包括:
第一獲取模塊,用于獲得多個樣本集合,每個樣本集合包括對應取樣時間段內的樣本數據;
采樣率設置模塊,用于根據每一個樣本集合對應的采樣時間段,設置該樣本集合對應的采樣率;
第二獲取模塊,用于獲得多個根據采樣率采樣后的樣本集合;
重要程度值確定模塊,用于分別設置所述多個采樣后的樣本集合的重要程度值;
樣本數據修正模塊,用于利用該重要程度值修正所述多個采樣后的樣本集合中的每一個樣本數據,獲得修正后的樣本數據;
訓練模塊,用于將每一個所述修正后的樣本數據輸入機器學習系統,對該機器學習系統進行訓練。
10.如權利要求9所述的機器學習系統的訓練系統,其特征在于,所述樣本數據修正模塊用于:
將每一個所述重要程度值與對應的采樣后的樣本集合中的每一個樣本數據相乘,獲得修正后的樣本數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610113716.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種內存管理方法及裝置
- 下一篇:一種基于大數據的知識點掌握概率計算方法





