[發明專利]數據庫生成測試數據的方法、裝置、終端及介質有效
| 申請號: | 201910372232.2 | 申請日: | 2019-05-06 |
| 公開(公告)號: | CN110263029B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 李思原 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2455;G06F40/284;G06F18/214;G06N3/0455 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 胡海國 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據庫 生成 測試數據 方法 裝置 終端 介質 | ||
1.一種數據庫生成測試數據的方法,其特征在于,所述方法包括:
獲取需要生成測試數據的數據庫表及所述數據庫表中數據的數據類型;
將所述數據庫表中預先存儲的與所述數據類型對應的數據范圍,作為所述測試數據的取值范圍;
在所述取值范圍內,隨機生成目標數據;
根據預設的所述測試數據的插入規則,將生成的目標數據插入到所述數據庫表中;
所述數據類型為語句;
相應地,所述將所述數據庫表中預先存儲的與所述數據類型對應的數據范圍,作為所述測試數據的取值范圍的步驟,包括:
獲取所述數據庫表中預先存儲的與所述數據類型對應的帶標簽的訓練樣本數據,并生成對應的分類詞向量;
將所述分類詞向量正向輸入已訓練的自編碼神經網絡模型,得到樣本數據的隱含特征;
計算樣本數據的所述隱含特征的向量差,并作為所述測試數據的取值范圍;
所述在所述取值范圍內,隨機生成目標數據的步驟,包括:
獲取所述數據庫表中預設的參考數據,并生成所述參考數據對應的文本詞向量;
將所述文本詞向量逆向輸入已訓練的自編碼神經網絡模型,得到所述自編碼神經網絡模型的中間隱層的隱含特征;
在所述取值范圍內隨機生成取值需求,并根據生成的取值需求修正所述隱含特征;
將修正后的隱含特征作為所述自編碼神經網絡模型的中間隱層,自所述中間隱層逆向生成所述自編碼神經網絡模型的輸入層對應的詞向量;
根據生成的詞向量,生成對應的文本,作為目標數據;
所述在所述取值范圍內隨機生成取值需求,并根據生成的取值需求修正所述隱含特征的步驟,包括:
在所述取值范圍內,隨機生成所述隱含特征對應的調節向量;
將所述隱含特征與所述調節向量的向量差,作為修正后的隱含特征。
2.如權利要求1所述的數據庫生成測試數據的方法,其特征在于,所述自編碼神經網絡模型的中間隱層為多層時;
相應地,所述將所述文本詞向量逆向輸入已訓練的自編碼神經網絡模型,得到所述自編碼神經網絡模型的中間隱層的隱含特征的步驟,包括:
將所述文本詞向量從已訓練的自編碼神經網絡模型的輸出層輸入,自所述輸出層逆向生成所述自編碼神經網絡模型的中間隱層的隱含特征,作為所述自編碼神經網絡模型的中間隱層的隱含特征,其中,
當所述中間隱層為奇數層時,取最中間的中間隱層對應的隱含特征作為所述自編碼神經網絡模型的中間隱層的隱含特征;
當所述中間隱層為偶數層時,取最中間的兩個中間隱層對應的隱含特征的平均值作為所述自編碼神經網絡模型的中間隱層的隱含特征。
3.如權利要求1所述的數據庫生成測試數據的方法,其特征在于,所述獲取所述數據庫表中預設的參考數據,并生成所述參考數據對應的文本詞向量的步驟之前,所述方法還包括如下步驟:
建立自編碼神經網絡模型;
獲取不帶類別標簽的訓練樣本數據,并生成對應的詞向量;
將所述詞向量正向輸入,訓練所述自編碼神經網絡模型,其中,訓練過程為:
將所述詞向量正向輸入,正向訓練所述自編碼神經網絡模型的第一隱層,在隱層為多層時,將第一隱層由原始輸入轉化成由隱藏單元激活值組成的向量,將該向量作為第二隱層的輸入,繼續訓練得到第二層的參數,重復執行將前一層的輸出作為下一層輸入依次訓練,在訓練每一層參數的時候,其他各層的參數保持不變。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910372232.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種應用于搜索服務的全量同步方法
- 下一篇:基于視聯網的數據獲取方法和裝置





