[發明專利]針對表格數據的仿真數據生成方法、裝置及電子設備有效
| 申請號: | 202211029674.5 | 申請日: | 2022-08-26 |
| 公開(公告)號: | CN115455668B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 付希明;劉川意;韓培義;莊榮飛 | 申請(專利權)人: | 哈爾濱工業大學(深圳) |
| 主分類號: | G06F30/20 | 分類號: | G06F30/20;G06F40/18 |
| 代理公司: | 深圳市添源創鑫知識產權代理有限公司 44855 | 代理人: | 覃迎峰 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 表格 數據 仿真 生成 方法 裝置 電子設備 | ||
1.一種針對表格數據的仿真數據生成方法,在集中場景下,針對
獲取累計分布表及逆累計分布表:將每一列數據進行區間劃分,統計每一個區間內的數據的個數,計算得到每個區間
獲取每一列均值和列協方差矩陣:對每一列數據,根據累計分布表變換得到數據,令為第
;
生成聯合高斯分布數據:從均值為,協方差為的聯合高斯分布中采樣得到聯合高斯分布數據;
仿真數據生成:?對每一列查詢逆累計分布表,具體為:記第
2.根據權利要求1所述的針對表格數據的仿真數據生成方法,其特征在于,所述逆累計分布表的取值是累計分布表的概率值對應區間內的任意一個值。
3.根據權利要求1所述的針對表格數據的仿真數據生成方法,其特征在于,所述生成聯合高斯分布數據的替代方法如下:
采用標準正態分布獨立地從高斯分布采樣得到,每個元素?;
對做變換仿射得到列之間有關聯關系的聯合高斯分布數據,其中通過Cholesky分解得到。
4.一種針對表格數據的仿真數據生成方法,在分布式場景下,有個數據節點,第個數據節點持有行數據,總共有行數據,每一行數據有列,第個數據節點的第
獲取累計分布表及逆累計分布表:統計每個數據節點中離散列的取值為
獲取全局每一列均值和列協方差矩陣:對每一列數據,根據累計分布表得到數據,令為第
生成聯合高斯分布數據:從均值為,協方差為的聯合高斯分布中采樣得到聯合高斯分布數據;
仿真數據生成:?對每一列查詢逆累計分布表,具體為:記第
5.根據權利要求4所述的針對表格數據的仿真數據生成方法,其特征在于,所述生成聯合高斯分布數據的替代方法如下:
采用標準正態分布獨立地從高斯分布采樣得到,每個元素?;
對做變換仿射得到列之間有關聯關系的聯合高斯分布數據,其中通過Cholesky分解得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學(深圳),未經哈爾濱工業大學(深圳)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211029674.5/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





