[發明專利]校驗處理的方法、裝置、電子設備和存儲介質有效
| 申請號: | 201810045917.1 | 申請日: | 2018-01-17 |
| 公開(公告)號: | CN108256074B | 公開(公告)日: | 2020-06-23 |
| 發明(設計)人: | 崔金輝 | 申請(專利權)人: | 貝殼找房(北京)科技有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 校驗 處理 方法 裝置 電子設備 存儲 介質 | ||
1.一種校驗處理的方法,其特征在于,所述方法包括:
獲取待校驗的數據倉庫的模型,每一模型包括多個字段信息,所述字段信息包括字段定義和字段類型;
根據預先存儲的數據字典,對所述字段信息進行校驗,所述數據字典包括多個標準用語,每一標準用語包括標準定義和標準類型;
若所述字段定義與標準定義匹配且所述字段類型與標準類型不匹配,則將所述字段類型修改為與標準類型一致;
若字段定義與標準定義匹配且字段類型與標準類型不匹配,則將字段類型修改為與標準類型一致的步驟之后,所述方法包括:
如果字段定義與標準定義不匹配,則對每一字段信息進行數據預處理,得到多個詞素;
獲取預先存儲的規則管理庫,所述規則管理庫包括多個替換規則,每一替換規則包括修飾詞和分類詞;
如果詞素與修飾詞匹配,則判斷是否存在所述詞素的分類詞;
如果不存在,則將所述詞素替換為所述詞素和對應的分類詞。
2.根據權利要求1所述的方法,其特征在于:所述字段定義包括字段名和字段描述,所述標準定義包括標準名和標準描述,相應地,根據預先存儲的數據字典,對字段信息進行校驗的步驟具體為:
若所述字段名與標準名匹配,則校驗所述字段描述是否與標準描述一致,并校驗字段類型是否與標準類型一致;
或者;
若所述字段描述與標準描述匹配,則校驗所述字段名是否與標準名一致,并校驗字段類型是否與標準類型一致。
3.根據權利要求1所述的方法,其特征在于:如果字段定義與標準定義不匹配,則對每一字段信息進行數據預處理,得到多個詞素的步驟具體為:
對每一字段信息進行解析,生成對應的json字符串;
針對每一json字符串,進行分詞處理,得到多個詞素。
4.根據權利要求1所述的方法,其特征在于:所述詞素包括中文詞素和/或英文詞素,相應地,若詞素與修飾詞匹配,則判斷是否存在所述詞素的分類詞的步驟之后,所述方法包括:
如果詞素與修飾詞不匹配,則獲取預先存儲的業務字典,所述業務字典包括多個業務用語,每一業務用語包括中文用語和英文用語;
如果中文詞素與中文用語匹配且所述詞素中不存在對應的英文用語,則備注所述中文詞素,以供增加所述中文詞素的英文用語;
如果英文詞素與英文用語匹配且所述詞素中不存在英文用語對應的中文用語,則備注所述英文詞素,以供增加所述英文詞素的中文用語。
5.根據權利要求3所述的方法,其特征在于:所述詞素包括中文詞素和/或英文詞素,相應地,將所述詞素替換為所述詞素和對應的分類詞的步驟之后,所述方法包括:
獲取預先存儲的業務字典,所述業務字典包括多個業務用語,每一業務用語包括中文用語和英文用語;
如果中文詞素與中文用語匹配且所述詞素中不存在對應的英文用語,則備注所述中文詞素,以供增加所述中文詞素的英文用語;
如果英文詞素與英文用語匹配且所述詞素中不存在英文用語對應的中文用語,則備注所述英文詞素,以供增加所述英文詞素的中文用語。
6.根據權利要求1所述的方法,其特征在于:若字段定義與標準定義匹配且字段類型與標準類型不匹配,則將字段類型修改為與標準類型一致的步驟之后,所述方法包括:
如果字段定義與標準定義不匹配,則對所述字段定義進行訓練;
若滿足預設的條件,則將所述字段定義作為標準定義。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貝殼找房(北京)科技有限公司,未經貝殼找房(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810045917.1/1.html,轉載請聲明來源鉆瓜專利網。





