[發明專利]一種數據表的生成方法、裝置及系統在審
| 申請號: | 202010566293.5 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111814445A | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 管磊;王萌;姚均霖;陳燕 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06F40/183 | 分類號: | G06F40/183;G06F8/71;G06N20/00 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 吳秀娥 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據表 生成 方法 裝置 系統 | ||
本說明書提供了一種數據表的生成方法、裝置及系統,該方法包括:獲取配置信息,其中,配置信息包括用于描述待生成的數據表中每列數據對象所代表的字段、及每一字段對應的數據對象的限定條件的信息;根據配置信息生成數據表,其中,數據表中每一數據對象均滿足對應的限定條件。
技術領域
本說明書涉及數據處理技術領域,更具體地,涉及一種數據表的生成方法、一種數據表的生成裝置、一種包括至少一個計算裝置和至少一個存儲裝置的系統、及一種計算機可讀存儲介質。
背景技術
隨著人工智能、大數據等技術的快速發展和廣泛應用,不斷涌現出新的技術和應用場景。這些新的技術和場景首先需要用特定的數據進行實驗或者是測試。
在現有技術中,通常是由開發者人工構建符合應用場景或具體需求的數據表,進行相應的實驗或測試。但是,由開發者來構建數據表的效率較低,且耗費人力,增加了測試成本。
發明內容
本說明書的一個目的是提供一種自動生成數據表的新技術方案。
根據本說明書的第一方面,提供了一種數據表的生成方法,包括:
獲取配置信息,其中,所述配置信息包括用于描述待生成的數據表中每列數據對象所代表的字段、及每一所述字段對應的數據對象的限定條件的信息;
根據所述配置信息生成數據表,其中,所述數據表中每一數據對象均滿足對應的限定條件。
可選的,所述獲取配置信息包括:
提供配置信息的配置界面;
通過所述配置界面獲取所述配置信息。
可選的,所述獲取配置信息包括:
提供用于上傳配置文件的入口;
通過所述入口獲取用戶上傳的配置文件;
解析所述配置文件,得到所述配置信息。
可選的,還包括:
檢測所述配置文件是否合法;
在所述配置文件合法的情況下,執行所述解析所述配置文件,得到所述配置信息的步驟;
在所述配置文件非法的情況下,生成錯誤日志。
可選的,所述配置文件的格式為xlsx、csv、tsv、parquet中的任意一種。
可選的,還包括:
在界面中提供用于創建數據處理流程圖的畫布區域;
所述信息獲取模塊還用于:
響應于用戶選擇目標數據源的操作,將用戶選擇的所述目標數據源展示在所述畫布區域;其中,所述目標數據源中包含所述配置信息;
所述數據表生成模塊還用于:
響應于用戶選擇目標算子的操作,將用戶選擇的所述目標算子展示在所述畫布區域;其中,所述目標算子用于根據輸入的信息生成數據表;
將所述畫布區域中的所述目標數據源和所述目標算子進行連接,構建數據處理流程圖;
運行所述數據處理流程圖,得到所述數據表。
可選的,所述配置信息還包括數據表的總行數、和用于并行生成所述數據表的執行單元的第一數量,
所述根據所述配置信息生成數據表包括:
根據所述總行數和并行生成所述數據表的執行單元的第一數量,確定每一執行單元所生成的數據對象的行數,作為第二數量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010566293.5/2.html,轉載請聲明來源鉆瓜專利網。





