[發明專利]產生式模型的訓練方法、數據生成方法、裝置、介質和設備有效
| 申請號: | 202010697904.X | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111598189B | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 陳鍵飛;朱軍;田天 | 申請(專利權)人: | 北京瑞萊智慧科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08;G06N3/04 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 郭棟梁 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 產生 模型 訓練 方法 數據 生成 裝置 介質 設備 | ||
1.一種產生式模型的訓練方法,所述產生式模型包括數據增廣網絡和概率變換網絡,所述方法包括:
通過所述數據增廣網絡基于訓練數據和一隨機數進行數據增廣;計算增廣得到的數據的概率密度;
將所述訓練數據和增廣得到的數據拼接;
通過所述概率變換網絡基于拼接后的數據進行變換,其中,所述概率變換網絡包括至少一個可逆變換層,其中每一可逆變換層的正向變換的輸入為拼接后的數據或前一可逆變換層輸出的變換后的拼接數據,輸出為變換后的拼接數據以及所述變換的雅克比矩陣的行列式的對數;
獲取變換后的拼接數據的概率密度;
以使增廣得到的數據的概率密度和變換得到的數據的概率密度之差最小為目標進行優化,以更新所述數據增廣網絡和概率變換網絡的參數。
2.如權利要求1所述的產生式模型的訓練方法,其中,所述隨機數根據預設條件生成。
3.如權利要求2所述的產生式模型的訓練方法,其中,所述預設條件至少包括待生成隨機數的維度以及生成的隨機數需服從的數據分布。
4.如權利要求1-3中任一所述的產生式模型的訓練方法,其中,所述訓練數據中包括多個訓練樣本。
5.如權利要求4所述的產生式模型的訓練方法,其中,所述數據增廣網絡包括至少一個可逆變換層,其中每一可逆變換層的正向變換的輸入為所述訓練數據和初始輸入的隨機數或前一可逆變換層輸出的變換后的隨機數,輸出為變換后的隨機數以及所述變換的雅克比矩陣的行列式的對數。
6.如權利要求5所述的產生式模型的訓練方法,其中,計算增廣得到的數據的概率密度,包括:
計算初始輸入的所述隨機數在標準正態分布下的概率密度;
獲取各層正向變換輸出的雅克比矩陣的行列式的對數之和;
以所述隨機數在標準正態分布下的概率密度與各層正向變換輸出的雅克比矩陣的行列式的對數之和的差作為增廣得到的數據的概率密度。
7.如權利要求1所述的產生式模型的訓練方法,其中,獲取變換后的拼接數據的概率密度,包括:
計算最終輸出的變換后的拼接數據在標準正態分布下的概率密度;
獲取各層正向變換輸出的雅克比矩陣的行列式的對數之和;
以所述拼接數據在標準正態分布下的概率密度與各層正向變換輸出的雅克比矩陣的行列式的對數之和的和作為變換后的拼接數據的概率密度。
8.如權利要求4所述的產生式模型的訓練方法,其中,采用隨機梯度優化法進行優化。
9.如權利要求8所述的產生式模型的訓練方法,其中,根據預設次數進行優化。
10.一種數據生成方法,其中,利用權利要求1-9中任一項所述的產生式模型的訓練方法訓練得到的產生式模型進行數據生成,包括:
獲取需生成的數據的生成參數,其中,所述生成參數至少包括需生成數據的數目;
基于所述生成參數利用所述產生式模型進行數據生成,包括:
根據需生成數據的數目提供服從正態分布的隨機數;
將所述隨機數輸入所述產生式模型的概率變換網絡,由所述概率變換網絡進行逆變換;
從逆變換后的結果中保留特定維作為生成的數據。
11.如權利要求10所述的數據生成方法,其中,保留結果中的前特定維數據作為生成的數據,其中所述特定維的維數與訓練數據的維數相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京瑞萊智慧科技有限公司,未經北京瑞萊智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010697904.X/1.html,轉載請聲明來源鉆瓜專利網。





