[發明專利]一種基于單快照的多體模擬有損壓縮技術在審
| 申請號: | 201810081727.5 | 申請日: | 2018-01-29 |
| 公開(公告)號: | CN108182283A | 公開(公告)日: | 2018-06-19 |
| 發明(設計)人: | 夏春秋 | 申請(專利權)人: | 深圳市唯特視科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H03M7/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市高新技術產業園*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 排序 壓縮 索引數組 多體 快照 壓縮技術 壓縮比 優化 分子動力學模擬 構造預測 模擬數據 模型代替 擬合模型 線性曲線 預測模型 重新排序 返回 失真率 數據集 再使用 熵編碼 數組 索引 分段 數據庫 基數 宇宙 應用 | ||
1.一種基于單快照的多體模擬有損壓縮技術,其特征在于,主要包括預測模型(一);有損壓縮的優化(二)。
2.基于權利要求書1所述的預測模型(一),其特征在于,使用最后返回值模型代替線性曲線擬合模型,最后返回值模型比線性曲線擬合模型具有更高的壓縮比,平均每個變量的壓縮比提高了10.1%;最后返回值模型采用具有很多量化區間的線性比例量化的方法,使得熵編碼可以應用于數據庫的絕大部分數據。
3.基于權利要求書2所述的最后返回值模型以及線性曲線擬合模型,其特征在于,最后返回值模型利用先前一個數據點的預測值來估計當前時刻的數據點,即:最后返回值模型簡單有效,在實際當中得到廣泛的應用;
線性曲線擬合模型利用先前兩個數據點的值來預測當前壓縮的數據點,即:其中,vxi-1和vxi-2表示先前兩個數據點的值。
4.基于權利要求書1所述的有損壓縮的優化(二),其特征在于,包括針對分子動力學模擬數據集的有損壓縮進行優化和針對宇宙模擬數據集的有損壓縮進行優化;
其中,針對分子動力學模擬數據集的有損壓縮進行優化,提出一種優化策略,其在保持相同的壓縮比的情況下,把壓縮速率提升至原來的兩倍;這個策略包含以下兩個步驟:
(1)執行部分基數排序,實現對R索引數組的排序,達到提高壓縮性能的目的;通過部分基數排序提高壓縮比;
(2)使用最后返回值有損壓縮方法,作用在重新排序的數組(xx,yy,zz),而非直接作用于壓縮的R索引數組;將數據集劃分成為多個片段,基于每個片段上面的xx、yy和zz構造R索引數組;然后使用基數排序法對R索引數組進行分段排序。
5.基于權利要求書4所述的有損壓縮,其特征在于,其與無損壓縮是數據壓縮技術的兩個分類;設計并完善有損壓縮技術,可以用來壓縮科學數據;大部分的有損壓縮技術是為網格數據集設計的,網格數據集里面的相鄰的數據之間具有強相干性。
6.基于權利要求書4所述的R索引數組,其特征在于,首先,通過一個用戶設定的誤差門限分割坐標變量,將其值從浮點數轉化成整數;然后,通過交叉存儲三個坐標變量(xxi,yyi,zzi)的二進制表達式,產生R索引,即Ri。
7.基于權利要求書4所述的部分基數排序,其特征在于,忽略最后的幾個最低有效位,然后從倒數第n位開始進行基數排序;由于R索引數組是由三個坐標變量構造得到的,所以在每一輪按三位對其進行排序;部分基數排序不會減低壓縮比的原因在于,重新排序好的數據數組在非常小的索引范圍內甚至在全部基數R索引排序方法里面,仍然能夠展現局部的不規則性。
8.基于權利要求書7所述的排序,其特征在于,排序是一種用于增強數據連續性的經典方法,其具有諸多局限性,特別在快照具有大量的數據點時,其局限性更加顯著;其局限性表現在:第一,雖然排序法是最快的算法,但它也是一個十分耗時的操作;第二,由于重新排序的數據的位置,壓縮器必須采用一個額外的索引數組來記錄每一個點的原始位置,這將極大地限制壓縮比;但是,對于分子元素來說,不需要對額外的索引信息進行排序,因為只要相同分子對應的元素的位置或者索引具有連續性,那么在重構的數據集里面每一個數組的分子元素可以被重新排序。
9.基于權利要求書4所述的針對宇宙模擬數據集的有損壓縮進行優化,其特征在于,根據基于速度的R索引數組排序和基于坐標-速度的R索引排序,利用兩個候選的解決方案來重組數據。
10.基于權利要求書9所述的基于速度的R索引數組排序和基于坐標-速度的R索引排序,其特征在于,基于速度的R索引數組排序的策略與傳統的優化方法相似;該策略平均可以提高20%的速度變量的壓縮比,但其坐標變量的壓縮比卻嚴重下降;
而對于基于坐標-速度的R索引排序,由于在至少使用一類R索引排序策略時,xx、zz、vx、vy、vz的壓縮比可以得到提升,但是yy的壓縮比總是減少;特殊地,yy在很寬的索引范圍里是遞增排序的,因此任何想要對其變量進行重新排序的策略,諸如基于R索引的排序策略,都會得到混亂的排序結果,從而得到低壓縮比;所以,具有高度自相關的有序變量不適用于基于R索引的排序方法,而改進的使用最后返回值模型的有損壓縮方法,具有最大的壓縮比。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市唯特視科技有限公司,未經深圳市唯特視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810081727.5/1.html,轉載請聲明來源鉆瓜專利網。





