[發明專利]樣本增強方法、模型訓練方法及系統在審
| 申請號: | 202110646519.7 | 申請日: | 2021-06-10 |
| 公開(公告)號: | CN113420799A | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 王士波;陳露;吳永文;甘雪琴;鄭歡歡;胡益炯;宋菲 | 申請(專利權)人: | 北京宜能高科科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F30/27 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 劉偉 |
| 地址: | 100020 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 增強 方法 模型 訓練 系統 | ||
1.一種樣本增強方法,其特征在于,包括:
將變量劃分為獨立變量、部分關聯變量和剩余關聯變量;
根據歷史生產數據中每種變量對應的歷史數據,獲取每種變量對應的歷史數據分布范圍;
在每個獨立變量對應的分布范圍內隨機生成多個隨機數據,根據獨立變量對應的隨機數據計算出部分關聯變量對應的中間數據,然后采用預先訓練完成的簡化模型以隨機數據和中間數據作為輸入計算并判斷計算結果是否收斂,并在收斂時獲取剩余關聯變量對應的剩余數據;
將隨機數據、中間數據和剩余數據整理合并成作為后續模擬的輸入數據;
采用歐式距離對輸入數據進行聚類得到多組子樣本集,所述子樣本集中包括多個樣本,并對每組所述子樣本集中的樣本進行排序;
通過預先訓練完成的嚴格機理模型,對每個子樣本集中樣本按照順序進行分步模擬計算,得到樣本的輸出數據;
匯總并合并各樣本的輸入數據和對應的輸出數據,得到通過樣本增強獲取的多個完整樣本數據;
對獲取的多個樣本數據的分布范圍進行可視化分析,并對稀疏區域的樣本進行補充。
2.根據權利要求1所述的方法,其特征在于,根據歷史生產數據中每種變量對應的歷史數據,獲取每種變量對應的歷史數據分布范圍的方法包括:
統計歷史生產數據中每種變量對應的歷史數據的上下限,并將上下限的范圍作為對應變量的歷史數據分布范圍。
3.根據權利要求1所述的方法,其特征在于,在每個獨立變量對應的分布范圍內隨機生成多個隨機數據的方法包括:
基于每個獨立變量對應的讀取數據分布范圍均勻的隨機生成多個隨機數據。
4.根據權利要求3所述的方法,其特征在于,根據獨立變量對應的隨機數據計算出部分關聯變量對應的中間數據的方法包括:
基于每個獨立變量對應的隨機數據,采用相關性分析方法分析歷史生產數據中的部分關聯變量與獨立變量間數據的相關性,獲取部分關聯變量與獨立變量的兩兩相互影響關系,得到部分關聯變量與獨立變量的關系式;
根據關系式,將獨立變量的隨機數據作為輸入計算對應部分關聯變量的中間數據;
將屬于同一組的部分關聯變量的中間數據與獨立變量的隨機數據合并共同作為同一組的輸入數據。
5.根據權利要求4所述的方法,其特征在于,采用預先訓練完成的簡化模型以隨機數據和中間數據作為輸入計算并判斷計算結果是否收斂,并在收斂時獲取剩余關聯變量對應的剩余數據的方法包括:
采用預先訓練的簡化模型對包括隨機數據和中間數據的輸入數據進行模擬,若模擬結果為收斂則認為該組輸入數據為有效樣本數據,并將模擬結果作為剩余關聯變量對應的剩余數據,若模擬結果為不收斂則認為該組輸入數據為無效樣本數據,則對輸入數據進行剔除;
將屬于同一組的剩余關聯變量對應的剩余數據與部分關聯變量以及獨立變量的輸入數據合并共同作為嚴格機理模型的同一組的輸入數據。
6.根據權利要求5所述的方法,其特征在于,通過預先訓練完成的嚴格機理模型,對每個子樣本集中的樣本按照順序進行分步模擬計算得到輸出數據的方法包括:
將子樣本集分配給不同模擬節點,每個模擬節點采用相同的預先訓練完成的嚴格機理模型對輸入數據進行計算,每個模擬節點按照接收樣本集中的樣本順序,對樣本輸入數據進行計算并判斷輸出結果是否收斂;
若收斂則將輸出數據保存于第一收斂樣本中,若未收斂則對相應的輸入數據進行改造調整后重新輸入嚴格機理模型,并將收斂的輸出數據保存于第二收斂樣本中;
將第一收斂樣本與第二收斂樣本合并得到剩余儀表對應的輸出數據;
其中,若收斂則將輸出數據保存于第一收斂樣本之后還包括:對樣本數據進行能量平衡驗證,若驗證結果為能量平衡則確認為收斂將輸出數據保存于第一收斂樣本中,若驗證結果為能量不平衡則所述輸出數據視為未收斂。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京宜能高科科技有限公司,未經北京宜能高科科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110646519.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:新一代堵漏注漿材料
- 下一篇:氧化脫氫制取丁二烯熱回收系統及其使用方法





