[發明專利]處理數據表的方法和系統有效
| 申請號: | 202010436543.3 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111611245B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | 包新啟;陳迪豪;陳靚;王子賢;王太澤 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/242;G06F16/2455;G06F16/248 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 董鋼;王兆賡 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 處理 數據表 方法 系統 | ||
1.一種處理數據表的方法,其中,所述方法包括:
獲取約束條件;
獲取存儲業務信息的一個主數據表和至少一個從數據表,其中,所述一個主數據表的索引字段與所述至少一個從數據表的索引字段對應;
根據所述約束條件,處理所述一個主數據表和所述至少一個從數據表,以獲得一個輸出數據表,
其中,所述一個輸出數據表中的每行數據對應于所述一個主數據表中的一行數據并且對應于所述至少一個從數據表的多行數據中的符合所述約束條件并且具有最大時間字段值的一行數據;
其中,所述約束條件包括主鍵約束和時間約束;所述時間約束用于限定所述一個主數據表中的與時間有關的字段,與所述至少一個從數據表中的與時間有關的字段之間的大小關系。
2.根據權利要求1所述的方法,其中,所述一個主數據表和所述至少一個從數據表存儲于離線數據庫,處理所述一個主數據表和所述至少一個從數據表的步驟包括:
基于索引字段,將所述一個主數據表中的每行數據與所述至少一個從數據表的一行數據合并,以獲得多行中間數據,其中,與所述一個主數據表中的任意一行數據合并的所述至少一個從數據表的一行數據是與所述任意一行數據通過索引字段對應并且符合所述約束條件的一行數據;
對所述多行中間數據進行篩選,以獲得所述一個輸出數據表,其中,在所述多行中間數據中的具有相同索引字段值的多行中間數據之中,將具有最大時間字段值的一行中間數據作為所述一個輸出數據表的一行數據。
3.根據權利要求1所述的方法,其中,所述一個主數據表和所述至少一個從數據表存儲于在線數據庫,處理所述一個主數據表和所述至少一個從數據表的步驟包括:
查找與所述一個主數據表中的每行數據對應的所述至少一個從數據表的一行數據,其中,與所述一個主數據表中的任意一行數據對應的所述至少一個從數據表的一行數據是與所述一個主數據表中的所述任意一行數據對應的所述至少一個從數據表的符合所述約束條件的各行數據之中的具有最大時間字段值的一行數據;
將所述一個主數據表中的每行數據與查找到的所述至少一個從數據表的一行數據進行合并,其中,所述一個主數據表中的任意一行數據與查找到的所述至少一個從數據表的一行數據合并后獲得的一行數據是所述一個輸出數據表的一行數據。
4.根據權利要求3所述的方法,其中,所述一個主數據表和所述至少一個從數據表存儲于作為在線數據庫的內存數據庫,內存數據庫中存儲有分片組,所述分片組中的每個分片對應至少一個第一級跳表和至少一個第二級跳表,索引字段值存儲于第一級跳表中,時間字段值存儲于第二級跳表中,所述一個主數據表和所述至少一個從數據表中的除了索引字段和時間字段之外的字段的值存儲于共享存儲空間中。
5.根據權利要求4所述的方法,其中,與所述一個主數據表中的任意一行數據對應的所述至少一個從數據表中的各行數據基于第一級跳表來查找,所述各行數據中的具有最大時間字段值的一行數據基于第二級跳表來確定。
6.根據權利要求4所述的方法,其中,合并后產生的輸出數據表的每行數據的索引字段值和時間字段值分別存儲于第一級跳表和第二級跳表中,合并后的輸出數據表的每行數據的除了索引字段和時間字段之外的字段的值存儲于所述共享存儲空間中。
7.根據權利要求4所述的方法,其中,所述方法適用于金融反欺詐場景和/或商品推薦場景,所述業務信息包括用戶行為信息,所述索引字段存儲用戶標識符,所述輸出數據表存儲與每個用戶標識符對應、符合所述約束條件且時間最近的一行數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010436543.3/1.html,轉載請聲明來源鉆瓜專利網。





