[發明專利]存儲系統和存儲控制方法在審

申請號：	202010160384.9	申請日：	2020-03-10
公開（公告）號：	CN112087234A	公開（公告）日：	2020-12-15
發明（設計）人：	成子貴洋;圷弘明;鈴木彬史	申請（專利權）人：	株式會社日立制作所
主分類號：	H03M7/30	分類號：	H03M7/30;G06N3/04;G06N3/08;G06N20/00
代理公司：	北京尚誠知識產權代理有限公司 11322	代理人：	龍淳;牛孝靈
地址：	日本***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	存儲系統存儲控制方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供一種存儲系統，使用基于機器學習的壓縮解壓器進行時序數據的有損壓縮，能夠改善壓縮率。在存儲系統中，以原數據(輸入到壓縮解壓器的時序數據)為對象，針對一種以上的統計量中的每一種，基于一個以上的參數計算統計量值，以與該原數據對應的解壓數據(從壓縮解壓器輸出的時序數據)為對象，針對上述一種以上的統計量中的每一種，基于一個以上的參數計算統計量值。壓縮解壓器基于以原數據為對象針對一種以上的統計量中的每一種而計算出的統計量值，和以解壓數據為對象針對一種以上的統計量中的每一種而計算出的統計量值，來進行機器學習。

技術領域

本發明大致涉及進行數據的壓縮和解壓的存儲控制。

背景技術

能夠縮減數據量的存儲系統已為人所知(例如專利文獻1)。這種存儲系統通常通過壓縮來縮減數據量。作為現有壓縮方法之一，已知游程法那樣將規定的單位塊內出現頻率高的字符串定義為詞典，將其替換成大小更小的符號的方法。

作為比游程法那樣的無損壓縮更能夠縮減數據量的技術，已知一些有損壓縮技術。例如，在專利文獻2中，將傳感器數據轉換為功率譜和相位譜，在功率值小于預設定的閾值的頻率下將功率和相位的值從記錄對象中排除，由此來縮減數據量。

現有技術文獻

專利文獻

專利文獻1：特開2007-199891號公報

專利文獻2：US6529927B1

發明內容

發明要解決的技術問題

在傳感器數據的分析中，為了進行統計性的分析，作為精度上的必要條件，有時會要求能夠保持數據的概率分布(例如，噪聲的均值和方差等)。但是，在專利文獻2中，若作為精度上的必要條件要求保持概率分布，會出現壓縮率變差的問題。例如，假定傳感器數據是包含白噪聲的數據。專利文獻2公開的技術是，在傳感器數據的功率譜隨頻帶而不同的情況下，在功率相對小的頻帶下丟棄功率和相位的值來壓縮傳感器數據。但是，對于白噪聲而言，其功率在所有頻帶是平均分布的。因此，在需要保持傳感器數據的統計性質的情況下，專利文獻2的技術無法丟棄特定頻帶的值，壓縮率會變差。

近年來，基于機器學習的壓縮解壓器已為人所知。作為這種壓縮解壓器之一例有自動編碼器。自動編碼器由神經網絡構成，通過學習特定領域的數據，能夠實現專門針對與學習數據處于相同領域的數據的壓縮。

通常，神經網絡以減小損失函數的函數值的方式進行學習。在構成壓縮解壓器的神經網絡中，損失函數典型地被設定為將輸入與輸出的誤差構建為指標的函數(誤差函數)。

本申請發明人對采用自動編碼器作為壓縮解壓器的一個比較例的存儲系統進行了深入研究，得到以下發現。

在設定為損失函數的誤差函數與符合精度要求的誤差函數不同的情況下，壓縮結果中會殘留對滿足精度要求而言并不必要的信息，其結果導致壓縮率變差。例如，在傳感器數據中，考慮精度上的要求是保持每1秒的平均值這一統計量的情況。為了使該精度要求得到滿足，在將傳感器數據按1秒的窗口劃分時，只要各窗口內的值之和在壓縮前后一致就夠了，不需要記錄窗口內的每個值。在這種情況下，若作為一例將均方誤差設定為損失函數，則壓縮結果中將會記錄對統計量的精度不會造成影響的信息(例如，窗口內的每個值)，其結果導致壓縮率變差。

上述問題在使用自動編碼器以外的基于機器學習的壓縮解壓器，來對傳感器數據以外的時序數據進行有損壓縮的情況下也同樣存在。

解決問題的技術手段

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于株式會社日立制作所，未經株式會社日立制作所許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010160384.9/2.html，轉載請聲明來源鉆瓜專利網。