[發明專利]元數據模型合標性檢查方法及裝置、存儲介質在審
| 申請號: | 201910651603.0 | 申請日: | 2019-07-18 |
| 公開(公告)號: | CN110414579A | 公開(公告)日: | 2019-11-05 |
| 發明(設計)人: | 陶濤 | 申請(專利權)人: | 北京信遠通科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京卓唐知識產權代理有限公司 11541 | 代理人: | 唐海力;李志剛 |
| 地址: | 100071 北京市豐臺區南四環西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相等 元數據 元數據模型 存儲介質 元素屬性 相似度 相似性匹配 規則檢查 判定規則 檢查 遺漏 判定 分析 計算機 保證 | ||
本發明實施例公開一種元數據模型合標性檢查方法及裝置、存儲介質,上述方法步驟包括:基于相似性匹配規則檢查合標雙方在不同元素屬性下的相似度,基于相等性判定規則判定合標雙方在元素屬性下的相等性,分析相似度和相等性,生成針對待合標元數據的合標結果。采用本發明,通過計算機對待合標的元數據進行相似相等性交叉檢查,分析待合標元數據的合標結果,可以提高合標的效率,避免合標過程出現遺漏,保證合標結果的準確性。
技術領域
本發明涉及模型合標檢查技術領域,尤其涉及一種元數據模型合標性檢查方法及裝置、存儲介質。
背景技術
目前各種數據中心匯集的數據種類繁多,標準不統一,需要建立一個標準化的基礎元數據模型庫進行統一規范和治理。元數據是定義真實數據的名稱、唯一編碼、文字標簽、類型、格式、長度、范圍和域值等各種屬性的基礎數據,用于定義標準數據實體表、元素字段等。只有符合元數據定義的具體數據,才能被數據處理終端正確讀取、處理和存儲。因此,元數據在數據存儲處理過程中十分重要,確保元數據自身的正確性和統一性是其先決條件。
元數據通常以特定的方式組織成元數據模型保存到元數據存儲系統中,并經過一定的審批流程成為元數據標準。當有新的元數據模型需要添加到元數據儲存系統中時,就需要將新模型與存儲系統中現有標準模型進行對比,以確保新的元數據模型與現有模型不沖突或重復。這種模型標準的對比過程稱為合標過程。傳統的合標過程是人工進行或通過簡單的對比程序執行。當元數據庫中元數據標準數量很大時,合標任務耗時長,而且可能出現遺漏或結果不準確的情況。
發明內容
本發明實施例提供一種元數據模型合標性檢查方法及裝置、存儲介質,通過計算機對待合標的元數據進行相似相等性交叉檢查,分析待合標元數據的合標結果,可以提高合標的效率,避免合標過程出現遺漏,保證合標結果的準確性。
本發明實施例第一方面提供了一種元數據模型合標性檢查方法,可包括:
基于相似性匹配規則檢查合標雙方在不同元素屬性下的相似度,元素屬性包括名稱、文字標簽、類型、格式、長度、范圍以及閾值等中的一個會多個,合標雙方包括待合標元數據和系統存儲的標準元數據;
基于相等性判定規則判定合標雙方在元素屬性下的相等性;
分析相似度和相等性,生成針對待合標元數據的合標結果。
進一步的,上述合標性檢查依次包括元素字段、數據實體表、元數據模型和標準四個層次的檢測過程,任一層次中待合標元數據中被合標的對象稱為待合標項,與之對應的標準合標元數據中的合標對象為合標項。
進一步的,上述元素屬性為元素字段的屬性。
進一步的,上述方法還包括:
當待合標項與合標項在元素屬性的任一種或多種屬性存在偏差,但近義詞詞庫匯總存在偏差屬性的相似性定義,則判定待合標項為相似項。
進一步的,上述基于相似性匹配規則檢查合標雙方在不同元素屬性下的相似度,包括:
根據相似度權重模型為不同的相似項匹配對應的相似度權重;
根據不同相似項和其對應的相似度權重確定合標雙方的相似度。
進一步的,上述方法還包括:
當合標雙方的所有待合標項和合標項均為相似項或者部分相等其余相似時,確定合標雙方相似。
進一步的,上述方法還包括:
當待合標元數據為已有標準元數據通過增加、修改或減少合標項后得到的待合標元數據時,確定合標雙方相似。
進一步的,上述方法還包括:
當待合標項與合標項在元素屬性的相等比例滿足相等性判定規則時,確定待合標項為相等項。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京信遠通科技有限公司,未經北京信遠通科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910651603.0/2.html,轉載請聲明來源鉆瓜專利網。





