[發明專利]數據生成裝置、預測器學習裝置、數據生成方法和學習方法在審
| 申請號: | 201980078575.6 | 申請日: | 2019-12-13 |
| 公開(公告)號: | CN113168589A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 但馬慶行;河野洋平 | 申請(專利權)人: | 株式會社日立制作所 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京尚誠知識產權代理有限公司 11322 | 代理人: | 龍淳;徐飛躍 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 生成 裝置 預測 學習 方法 學習方法 | ||
本發明提供一種生成數據集合的數據生成裝置,其包括:擾動生成部,其基于訓練數據集合的各元素的輸入和關于所述訓練數據集合的信息這兩者中的至少一者,來生成用于使所述元素變形的擾動集合;偽數據合成部,其根據所述訓練數據集合和所述擾動集合,來生成與所述訓練數據集合不同的新的偽數據集合;評價部,其計算所述訓練數據集合和所述偽數據集合的分布間距離或關于其的推算量,以及從所述擾動集合得到的偽數據相對于訓練數據的擾動的大小;和參數更新部,其更新所述擾動生成部生成所述擾動集合時所使用的參數,以使所述訓練數據集合與所述偽數據集合的分布間距離相接近,使擾動的大小或期待值成為預定的目標值。
本申請主張平成31年(2019年)1月10日申請的日本申請即特愿2019-2436的優先權,通過參照其內容,編入本申請。
技術領域
本發明涉及生成機器學習中使用的數據的數據生成裝置。
背景技術
目前,應用了機器學習的系統、服務正在普及。例如,許多企業通過運用裝置、設備、車輛等多種多樣的物理的資產(asset),來進行經濟活動。這些資產由于電氣的或機械的原因而有時不正常或發生故障。因此,適當通過預測的或應對措施即零件及消耗品的更換、單元的更換及修繕等而在運用上不會產生大的故障是重要的。但是,由于資產的復雜化、以及熟練的保養員或修理工的短缺等,有時無法采取適當的措施。因此,正在研究一種系統,其通過基于過去的運轉實績及修理歷史等信息來推薦適當的措施,補充保養員或操作員的作業,能夠實現資產穩定地運轉。
在上述的應用了機器學習的系統及服務中,預測器是根據關于輸入及輸出的訓練數據集合,基于學習其輸入輸出的關系性的被稱為監督學習或半監督學習的框架來構建的。該預測器對于訓練數據集合中未包含的數據要求高的預測性能(通用性能)。因此,目前提出了以神經網絡為代表的預測器的各種模型。
另一方面,作為另一種方法,有通過使將訓練數據集合適當地變形或變換而得到的偽數據集合與原始的訓練數據集合一起用于學習,以實現通用性能提高的方法。將這種偽數據生成稱為數據擴充。例如,通常來說,如果為圖像,則可以通過對訓練數據集合進行旋轉、擴大、縮小、移動等變形來擴充數據。然而,就上述的運轉實績及修理歷史等在產業上處理的大多數據而言,如圖像那種有效起作用的啟發式的數據擴充方法不清楚的情況也有很多。因此,采用通過將根據參數的分布的標本和原始的訓練數據集合混合來擴充數據的方法。例如,通過將遵循小的標準偏差的正態分布的標本的元素添加到原始數據的元素中,能夠進行數據擴充。然而,在數據擴充后的訓練數據集合的分布與原始的訓練數據集合的分布大不相同的情況下,性能有時降低。
作為本技術領域的背景技術,有以下的現有技術。在日本特開2006-343124號中,作為根據傳感器響應來推算化學物質濃度的技術,公開了以下技術,即:“掌握化學數據的插值誤差作為隨機變量,推算插值誤差的概率密度函數。通過反復多次生成遵循插值誤差的推算概率密度函數的偽隨機數矢量,并將偽插值誤差矢量與從插值曲面上的矢量隨機選出的矢量相加而生成新的數據矢量,生成反映了插值曲面及插值誤差的特征的多個數據矢量即偽數據。使神經網絡學習偽數據。將傳感器應用于未知的受驗試樣,測定傳感器響應。在學習完成后的神經網絡中輸入傳感器響應,根據神經網絡的輸出來推算多個化學物質的未知濃度。”。
發明內容
發明要解決的問題
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社日立制作所,未經株式會社日立制作所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980078575.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:抗金黃色葡萄球菌抗體的組合
- 下一篇:液晶乳化組合物及其制造方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





