[發(fā)明專利]一種數(shù)據(jù)生成方法和裝置有效
| 申請?zhí)枺?/td> | 201710240678.0 | 申請日: | 2017-04-13 |
| 公開(公告)號: | CN107403371B | 公開(公告)日: | 2020-06-09 |
| 發(fā)明(設(shè)計)人: | 劉照星 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06F16/22 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 陳蕾 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù) 生成 方法 裝置 | ||
本公開提供一種數(shù)據(jù)生成方法和裝置,其中方法包括:設(shè)置歸類字段的多個取值;對于每一個數(shù)據(jù)模塊,執(zhí)行如下操作:將所述歸類字段的每一個取值,分別與所述數(shù)據(jù)模塊中歸類字段之外的其他字段的字段配對集進行組合,得到分別對應(yīng)各個取值的模塊全量集;將各個數(shù)據(jù)模塊中對應(yīng)歸類字段的同一取值的模塊全量集,根據(jù)所述數(shù)據(jù)結(jié)構(gòu)的關(guān)聯(lián)關(guān)系進行聯(lián)合,得到所述數(shù)據(jù)結(jié)構(gòu)的全量數(shù)據(jù)集。本公開能夠支持復(fù)雜數(shù)據(jù)結(jié)構(gòu),可以滿足復(fù)雜數(shù)據(jù)結(jié)構(gòu)下的全量數(shù)據(jù)集的生成需求。
技術(shù)領(lǐng)域
本公開涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)生成方法和裝置。
背景技術(shù)
隨著機構(gòu)間業(yè)務(wù)合作越來越頻繁,對于不同的業(yè)務(wù)場景,需要根據(jù)不同的數(shù)據(jù)結(jié)構(gòu)設(shè)計一套業(yè)務(wù)模型,來支持業(yè)務(wù)運行。例如,在信貸業(yè)務(wù)中,風(fēng)險控制是其中一個重要因素,通過風(fēng)控可以獲取優(yōu)質(zhì)客戶,降低資金信貸風(fēng)險;實際實施中,可以設(shè)計一套授信模型,以及預(yù)警規(guī)則、校驗規(guī)則等確保風(fēng)險控制。
仍以信貸業(yè)務(wù)為例,在設(shè)計上述的預(yù)警規(guī)則、校驗規(guī)則和授信模型等之后,為了校驗這些模型規(guī)則的正確性,需要生成對應(yīng)該信貸業(yè)務(wù)場景的數(shù)據(jù)結(jié)構(gòu)的全量數(shù)據(jù)集,再利用該全量數(shù)據(jù)集去測試上述的模型和規(guī)則是否正確可行。在生成全量數(shù)據(jù)集的過程中,現(xiàn)有技術(shù)所使用的數(shù)據(jù)生成方法支持的是扁平的數(shù)據(jù)結(jié)構(gòu)的全覆蓋,然而實際業(yè)務(wù)合作中還將遇到復(fù)雜數(shù)據(jù)結(jié)構(gòu)的場景,目前的全量數(shù)據(jù)集生成方法無法滿足實際應(yīng)用的需要。
發(fā)明內(nèi)容
有鑒于此,本公開提供一種數(shù)據(jù)生成方法和裝置,以實現(xiàn)對復(fù)雜數(shù)據(jù)結(jié)構(gòu)下的全量數(shù)據(jù)集的覆蓋。
具體地,本公開是通過如下技術(shù)方案實現(xiàn)的:
第一方面,提供一種數(shù)據(jù)生成方法,所述方法用于生成一種數(shù)據(jù)結(jié)構(gòu)下的全量數(shù)據(jù)集,所述數(shù)據(jù)結(jié)構(gòu)包括至少一個數(shù)據(jù)模塊,每個數(shù)據(jù)模塊下包括至少一個數(shù)據(jù)字段;各個數(shù)據(jù)模塊中均包括歸類字段,對于所述全量數(shù)據(jù)集中的每一個數(shù)據(jù),所述歸類字段在不同數(shù)據(jù)模塊下具有相同取值;所述方法包括:
設(shè)置所述歸類字段的多個取值;
對于每一個數(shù)據(jù)模塊,執(zhí)行如下操作:將所述歸類字段的每一個取值,分別與所述數(shù)據(jù)模塊中歸類字段之外的其他字段的字段配對集進行組合,得到分別對應(yīng)各個取值的模塊全量集;
將各個數(shù)據(jù)模塊中對應(yīng)歸類字段的同一取值的模塊全量集,根據(jù)所述數(shù)據(jù)結(jié)構(gòu)的關(guān)聯(lián)關(guān)系進行聯(lián)合,得到所述數(shù)據(jù)結(jié)構(gòu)的全量數(shù)據(jù)集。
第二方面,提供一種數(shù)據(jù)生成裝置,所述裝置用于生成一種數(shù)據(jù)結(jié)構(gòu)下的全量數(shù)據(jù)集,所述數(shù)據(jù)結(jié)構(gòu)包括至少一個數(shù)據(jù)模塊,每個數(shù)據(jù)模塊下包括至少一個數(shù)據(jù)字段;各個數(shù)據(jù)模塊中均包括歸類字段,對于所述全量數(shù)據(jù)集中的每一個數(shù)據(jù),所述歸類字段在不同數(shù)據(jù)模塊下具有相同取值;所述裝置包括:
取值設(shè)置模塊,用于設(shè)置所述歸類字段的多個取值;
組合處理模塊,用于對于每一個數(shù)據(jù)模塊,執(zhí)行如下操作:將所述歸類字段的每一個取值,分別與所述數(shù)據(jù)模塊中歸類字段之外的其他字段的字段配對集進行組合,得到分別對應(yīng)各個取值的模塊全量集;
全量獲取模塊,用于將各個數(shù)據(jù)模塊中對應(yīng)歸類字段的同一取值的模塊全量集,根據(jù)所述數(shù)據(jù)結(jié)構(gòu)的關(guān)聯(lián)關(guān)系進行聯(lián)合,得到數(shù)據(jù)結(jié)構(gòu)的全量數(shù)據(jù)集。
本公開的數(shù)據(jù)生成方法和裝置,通過使用歸類聯(lián)合配對算法,通過歸類字段找到各個模塊中對應(yīng)同一用戶的數(shù)據(jù),并可以通過配對算法對模塊中的其他各個字段進行配對,還可以根據(jù)數(shù)據(jù)結(jié)構(gòu)的層級關(guān)系將各個模塊進行聯(lián)合,從而形成該數(shù)據(jù)結(jié)構(gòu)下的全量數(shù)據(jù)集,這種方法能夠支持復(fù)雜數(shù)據(jù)結(jié)構(gòu),可以滿足復(fù)雜數(shù)據(jù)結(jié)構(gòu)下的全量數(shù)據(jù)集的生成需求。
附圖說明
圖1是本公開實施例提供的一個樹形數(shù)據(jù)結(jié)構(gòu)示意圖;
圖2是本公開實施例提供的一個數(shù)據(jù)生成方法的流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710240678.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





