[發明專利]使用人工智能機制進行集中式數據協調有效

申請號：	201910395511.0	申請日：	2019-05-13
公開（公告）號：	CN110543374B	公開（公告）日：	2022-12-02
發明（設計）人：	李中生;E·穆恩奎亞·塔皮亞;范靜筠;A·瓊詹;M·希瓦拉姆;S·巴德;S·文卡塔蘇布拉瑪尼揚;S·謝卡	申請（專利權）人：	埃森哲環球解決方案有限公司
主分類號：	G06F11/07	分類號：	G06F11/07
代理公司：	北京市金杜律師事務所 11256	代理人：	酆迅
地址：	愛爾蘭***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	使用人工智能機制進行集中數據協調
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明的實施例涉及使用人工智能機制進行集中式數據協調。一種集中式數據協調系統處理傳輸與多個過程之一相關的數據的至少兩個數據流，并且執行數據協調過程。在數據協調過程期間所標識的不匹配數據記錄被進一步分類為基于各種原因類別的經分類的記錄和不能被分類到原因類別中的不可協調記錄。不可協調記錄被標示以供用戶輸入。用戶輸入被記錄以進一步訓練數據協調系統。至少兩個數據流最初被轉換為自描述數據流，使用從數據流接收到的數據模型從該自描述數據流中提取實體和實體屬性。來自第一自描述數據流和第二自描述數據流的數據記錄被映射?；诟鶕祿f調規則而被估計的相應置信分數，從映射中選擇匹配對和不匹配對。

技術領域

本公開涉及用于數據協調的系統、方法和計算機可讀存儲介質。

背景技術

數據協調(reconciliation)是通常被實現以用于將來自源數據系統的數據記錄與目標數據系統中的數據記錄進行比較從而確保來自源數據系統的信息已經被準確地傳送到目標數據系統的過程。在數據傳輸期間，可能在映射和變換邏輯中出現錯誤。另外，諸如網絡斷供或交易中斷等運行時故障可能導致諸如缺失記錄、不正確的值、重復記錄、格式錯誤的數據等問題。如果不糾正這樣的錯誤，則可能存儲不正確的數據，從而導致系統故障，這導致可能影響客戶服務的不準確的見解。

發明內容

根據本公開的實施例，公開了一種集中式數據協調系統，包括：至少一個處理器；至少一個非暫態數據存儲裝置，其上存儲有自定義字典，自定義字典包括與第一自描述數據流和第二自描述數據流相關聯的令牌，令牌用于數據匹配并且自定義字典基于由數據協調系統接收的數據流而動態地可更新；以及至少一個非暫態計算機可讀介質，其存儲機器可讀指令，機器可讀指令使得至少一個處理器：將源自第一數據系統和第二數據系統的至少兩個數據流轉換為包括第一自描述數據流和第二自描述數據流的相應的至少兩個自描述數據流，其中第一自描述數據流包括相應的數據記錄和第一數據模型并且第二自描述數據流包括相應的數據記錄和第二數據模型；經由一個或多個雙向匹配通過采用自定義字典和數據協調規則中的一個或多個，將第一自描述數據流中包括實體和實體屬性的數據記錄映射到第二自描述數據流的數據記錄中的實體和實體屬性；至少基于數據協調規則，生成針對映射的相應的置信分數，其中置信分數指示經映射的數據記錄之間的匹配度；至少基于置信分數，從映射中標識與第一自描述數據流中的數據記錄中的一個或多個數據記錄相匹配的、第二自描述數據流中的數據記錄中的一個或多個數據記錄；至少基于置信分數，從來自第一自描述數據流和第二自描述數據流的數據記錄中確定不匹配數據記錄；將不匹配數據記錄分類成經分類的記錄和不可協調記錄，經分類的記錄被分類到一個或多個原因類別中，并且不可協調記錄包括不能被分類到原因類別中的不匹配數據記錄；針對經分類的記錄的至少一個子集，生成原因和推薦中的一個或多個；以及基于針對不可協調記錄而接收的用戶輸入，自動更新自定義字典、原因類別和數據協調規則中的一個或多個，針對不可協調記錄不能生成原因和推薦。

根據本公開的實施例，還公開了一種用于數據協調方法，包括：分別從第一數據系統和第二數據系統接收至少包括第一數據流和第二數據流的至少兩個數據流；從第一數據流和第二數據流構建相應的特征向量；基于特征向量，將第一數據流和第二數據流轉換為相應的自描述數據流，每個自描述數據流包括相應的數據模型；使用相應的數據模型，從自描述數據流中提取要被匹配的實體和實體的屬性；通過采用自定義字典將實體從自描述數據流中的第一自描述數據流映射到自描述數據流中的第二自描述數據流，自定義字典實現使用數據協調規則在一個或多個雙向匹配中映射實體；估計針對映射中的每個映射的置信分數；基于置信分數與置信分數閾值的比較，從映射中標識匹配記錄和不匹配記錄；將不匹配記錄的子集分類到一個或多個原因類別中，并且將不能被分類的、不匹配記錄的另一子集分類為不可協調記錄；建立一個或多個假設和針對假設中的每個假設的相應的差異置信分數，差異置信分數基于不可協調記錄沒有完成的數據協調規則中的一個或多個來指示針對經分類的記錄的假設的置信水平；以及針對具有高于置信閾值的相應的差異置信分數的經分類的記錄，生成包括原因和推薦中的一個或多個的報告；以及標示不可協調記錄以供用戶干預，該不可協調記錄具有低于置信閾值的相應的差異置信分數。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于埃森哲環球解決方案有限公司，未經埃森哲環球解決方案有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910395511.0/2.html，轉載請聲明來源鉆瓜專利網。