[發明專利]發布到數據倉庫在審
| 申請號: | 201980048334.7 | 申請日: | 2019-07-19 |
| 公開(公告)號: | CN112654977A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | A·布洛姆;D·米勒;馬歇爾·A·伊斯曼 | 申請(專利權)人: | 起元技術有限責任公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 美國馬*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發布 數據倉庫 | ||
1.一種用于自動生成可執行應用程序的方法,該可執行應用程序用于將數據進行轉換并加載到結構化數據集中,該結構化數據集用于存儲來自一個或多個聯網數據源的數據,該方法包括:
接收指定參數的值的至少一個元數據文件以及指定用于轉換數據饋送的邏輯規則的規則集映射,其中,將從聯網數據源接收每個數據饋送,并將結果加載到結構化數據集中;
驗證這些參數的值和用于轉換這些數據饋送的這些邏輯規則對于每個數據饋送是一致的;
根據這些參數的經驗證值和用于將每個數據饋送轉換為經轉換的記錄以便加載到該結構化數據集中的經驗證邏輯規則來生成數據規則,這些數據規則指定一個或多個標準;以及
生成用于運行時環境的可執行數據處理應用程序,該可執行數據處理應用程序能配置為:
從一個或多個數據源接收包括數據饋送的源數據;并且
根據所生成的數據規則,將該源數據轉換為滿足該結構化數據集的該一個或多個標準的經轉換數據。
2.如權利要求1所述的方法,其中,該可執行數據處理應用程序包括數據流圖、數據流子圖或多個數據流圖。
3.如權利要求1或2所述的方法,其中,該結構化數據集包括數據庫。
4.如前述權利要求中任一項所述的方法,其中,該源數據包括數據記錄,并且其中,該元數據文件中的參數指定該數據記錄的、表示該源數據的該數據記錄的鍵值的字段。
5.在從屬于權利要求4時如權利要求1至3中任一項所述的方法,其中,該元數據文件中的參數指定表示該源數據的鍵值的字段與該結構化數據集的表示該結構化數據集的另一鍵值的另一字段之間的映射。
6.在從屬于權利要求4時如權利要求1至3中任一項所述的方法,其中,該元數據文件中的參數指定該鍵值的格式,并且其中,該可執行數據處理應用程序被配置為將該鍵值轉換為具有由該參數指定的格式。
7.如前述權利要求中任一項所述的方法,進一步包括:
從數據存儲中檢索參數的默認值;以及
基于該參數的默認值定義這些數據規則。
8.如前述權利要求中任一項所述的方法,其中,邏輯規則為該結構化數據集的字段指定格式,該字段包括數據歷史值。
9.在從屬于權利要求8時如前述權利要求中任一項所述的方法,其中,該數據歷史值包括指示包括該數據歷史值的該結構化數據集的更新時間的時間戳。
10.如前述權利要求中任一項所述的方法,其中,接收該元數據文件包括:解析該元數據文件的標題行,以確定哪些參數具有該元數據文件中的指定值。
11.如前述權利要求中任一項所述的方法,其中,將該源數據轉換為滿足該結構化數據集的如由這些數據規則定義的該一個或多個標準的結構化數據包括:
確定該源數據的至少兩個不同部分指定相同的鍵值;以及
為該源數據的這兩個不同部分中的至少一個部分指定新的鍵值,該新的鍵值不同于這些相同的鍵值并且基于該結構化數據集的鍵序列。
12.如前述權利要求中任一項所述的方法,包括檢索該至少一個元數據文件未指定的一個或多個附加參數的一個或多個默認值,其中,對這些數據規則的定義是基于該一個或多個附加參數的這些默認值進行的。
13.如前述權利要求中任一項所述的方法,其中,該元數據文件包括一個或多個語義規則,該一個或多個語義規則指定用于解釋該經轉換的記錄的值的標簽。
14.如前述權利要求中任一項所述的方法,其中,該元數據文件中的這些參數包括數據質量參數,該數據質量參數指定用于包括在該經轉換的記錄中的可接受數據值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于起元技術有限責任公司,未經起元技術有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980048334.7/1.html,轉載請聲明來源鉆瓜專利網。





