[發明專利]一種測試數據的構造方法及裝置有效
| 申請號: | 202010971836.1 | 申請日: | 2020-09-16 |
| 公開(公告)號: | CN112131105B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 吝斌;王亞娟;康芊 | 申請(專利權)人: | 電信科學技術第十研究所有限公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郭永麗 |
| 地址: | 710061*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 測試數據 構造 方法 裝置 | ||
本發明提供了一種測試數據的構造方法及裝置,該方法包括:接收輸入的結構化樣本測試數據;獲取樣本測試數據的至少一種樣本數據類型及其對應的樣本數據特點;根據各樣本數據類型中包含的至少一個樣本數據種類以及各樣本數據種類對應的數據量,獲取各樣本數據類型對應的樣本數據分布特性;根據各樣本數據類型及其對應的樣本數據特點和樣本數據分布特性進行數據構造,生成預設構造數量的目標測試數據。本發明適用于軟件測試中大量數據的生成,滿足大數據測試中結構化數據的快速獲取,既減輕了測試人員數據準備的負擔,又保證了測試數據的大量性、完整性、多樣性,有效提高了測試效率和測試充分性。
技術領域
本發明涉及計算機測試技術領域,具體涉及一種測試數據的構造方法及裝置。
背景技術
互聯網的出現和快速發展,尤其是移動互聯網、物聯網設備的大規模使用,數據的來源已經不僅限于人機會話,而是大量通過設備、服務器、APP應用等自動產生的,機器產生的數據正在以幾何數量級增長。對軟件測試而言,數據質量是計算機軟件系統測試的一個重要維度,如何高效正確的驗證經過計算機軟件系統處理的至少百萬兆字節的數據是一個巨大的挑戰。
在軟件測試過程中,輸入到系統的測試數據與真實場景下的數據特征越吻合,得到的測試結果越準確。然而大量真實數據因隱私保護等原因不容易獲取,因此需要一種能夠保持數據真實特征的測試數據構造方法,用以產生大量符合真實場景特征的測試數據。
需要注意的是,本部分旨在為權利要求書中陳述的本公開的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
發明內容
本發明實施例提供一種測試數據的構造方法及裝置,以解決現有技術中因隱私保護等原因造成的無法獲取海量真實測試數據的問題。
第一方面,本發明實施例提供一種測試數據的構造方法,該方法包括:
接收輸入的結構化樣本測試數據;
獲取所述樣本測試數據的至少一種樣本數據類型及其對應的樣本數據特點;
根據各所述樣本數據類型中包含的至少一個樣本數據種類以及各所述樣本數據種類對應的數據量,獲取各所述樣本數據類型對應的樣本數據分布特性;
根據各所述樣本數據類型及其對應的樣本數據特點和樣本數據分布特性進行數據構造,生成預設構造數量的目標測試數據;其中,所述目標數據類型以及對應的目標數據特點和目標數據分布特性分別對應與所述樣本數據類型以及對應的樣本數據特點和樣本數據分布特性一致。
作為本發明第一方面的優選方式,所述根據各所述樣本數據類型中包含的至少一個樣本數據種類以及各所述樣本數據種類對應的數據量,獲取各所述樣本數據類型對應的樣本數據分布特性,包括:
獲取各所述樣本數據類型中包含的至少一個樣本數據種類,以及各所述樣本數據種類對應的數據量;
根據各所述樣本數據種類對應的數據量,計算各所述樣本數據種類的數量占比;
通過統計各所述樣本數據種類的數量占比,得到各所述樣本數據類型對應的樣本數據分布特性。
作為本發明第一方面的優選方式,在所述根據各所述樣本數據類型及其對應的樣本數據特點和樣本數據分布特性進行數據構造,生成預設構造數量的目標測試數據之前,還包括:
根據所述目標測試數據的預設構造數量,以及各所述樣本數據類型包含的各樣本數據種類的數量占比,分別計算所述目標測試數據中各目標數據類型包含的各目標數據種類對應的預設數據量。
作為本發明第一方面的優選方式,所述根據各所述樣本數據類型及其對應的樣本數據特點和樣本數據分布特性進行數據構造,生成預設構造數量的目標測試數據,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電信科學技術第十研究所有限公司,未經電信科學技術第十研究所有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010971836.1/2.html,轉載請聲明來源鉆瓜專利網。





