[發明專利]測試數據的擴充方法、裝置、設備及計算機可讀存儲介質在審
| 申請號: | 202110691032.0 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113535549A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 范超超;于超敏;王思睿 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F11/36 | 分類號: | G06F11/36;G06K9/62;G06N3/08 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何倚雯 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 測試數據 擴充 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
1.一種測試數據的擴充方法,其特征在于,所述擴充方法包括:
獲取原始數據集;其中,所述原始數據集包括至少一種業務類別的測試數據;
利用第一分類模型對所述原始數據集進行業務分類,得到每個業務類別所對應的原始數據子集;
針對各所述業務類別,利用所述業務類別的數據擴充策略對所述業務類別的原始數據子集進行數據擴充,得到所述業務類別的第一擴充數據子集;
將各所述業務類別的第一擴充數據子集進行合并,得到擴充數據集。
2.根據權利要求1所述的擴充方法,其特征在于,所述業務類別包括文字客服、輔助營銷、導航和外呼中的至少一種;和/或,所述測試數據為交互類數據。
3.根據權利要求1所述的擴充方法,其特征在于,在所述利用第一分類模型對所述原始數據集進行業務分類,得到每個業務類別所對應的原始數據子集之前,所述方法還包括以下步驟,以對所述第一分類模型進行訓練:
獲取第一樣本數據集,其中,所述第一樣本數據集包括多種業務類別的樣本測試數據,任意兩種所述業務類別之間的所述樣本測試數據的數量差小于預設閾值;
利用所述第一樣本數據集對預訓練的第一分類模型進行訓練。
4.根據權利要求1所述的擴充方法,其特征在于,所述利用所述業務類別的數據擴充策略對所述業務類別的原始數據子集進行數據擴充,得到所述業務類別的擴充數據子集,包括:
獲取與所述業務類別匹配的所述多種數據增強方式的最終擴充權重比;
基于所述多種數據增強方式的最終擴充權重比,利用所述多種數據增強方式對所述業務類別的原始數據子集進行數據擴充,得到所述業務類別的擴充數據子集。
5.根據權利要求4所述的擴充方法,其特征在于,所述獲取與所述業務類別匹配的所述多種數據增強方式的最終擴充權重比,包括:
利用所述業務類別的原始數據子集,確定所述業務類別的所述多種數據增強方式的初始擴充權重比;
對所述初始擴充權重比進行調整,得到所述最終擴充權重比。
6.根據權利要求5所述的擴充方法,其特征在于,所述對所述初始擴充權重比進行調整,得到所述最終擴充權重比,包括:
基于所述初始擴充權重比,利用所述多種數據增強方式對所述業務類別的原始數據子集進行數據擴充,得到所述業務類別的第二擴充數據子集;
檢測所述第二擴充數據子集是否滿足預設要求;
若不滿足,則調整所述初始擴充權重比,并重新執行所述基于所述初始擴充權重比,利用所述多種數據增強方式對所述業務類別的原始數據子集進行數據擴充,得到所述業務類別的第二擴充數據子集以及后續步驟;
若滿足,則將所述初始擴充權重比作為所述最終擴充權重比。
7.根據權利要求6所述的擴充方法,其特征在于,所述檢測所述第二擴充數據子集是否滿足預設要求,包括:
利用第二分類模型檢測所述第二擴充數據子集的業務類別是否正確,以得到所述第二擴充數據子集的有效程度;
判斷所述第二擴充數據子集的有效程度是否滿足預設程度閾值;
所述調整所述初始擴充權重比,包括:
根據所述有效程度對所述初始擴充權重比進行調整。
8.一種測試數據的擴充裝置,其特征在于,所述測試數據的擴充裝置包括:
數據獲取模塊,所述數據獲取模塊用于獲取原始數據集;其中,所述原始數據集包括至少一種業務類別的測試數據;
數據分類模塊,所述數據分類模塊用于利用第一分類模型對所述原始數據集進行業務分類,得到個業務類別所對應的原始數據子集;
數據擴充模塊,所述數據擴充模塊用于針對各所述業務類別,利用所述業務類別的數據擴充策略對所述業務類別的原每始數據子集進行數據擴充,得到所述業務類別的第一擴充數據子集;
數據合并模塊,所述數據合并模塊用于將各所述業務類別的第一擴充數據子集進行合并,得到擴充數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110691032.0/1.html,轉載請聲明來源鉆瓜專利網。





