[發明專利]一種SQL自動對標的匹配方法及裝置在審
| 申請號: | 202010674260.2 | 申請日: | 2020-07-14 |
| 公開(公告)號: | CN111563142A | 公開(公告)日: | 2020-08-21 |
| 發明(設計)人: | 張艷清;查文宇;周宇;劉俊良;金日海;王怡君 | 申請(專利權)人: | 成都四方偉業軟件股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/289;G06F40/247 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610041 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 sql 自動 標的 匹配 方法 裝置 | ||
本發明公開了一種SQL自動對標的匹配方法及裝置,主要涉及數據處理及數據治理領域,用于數據治理中采集到的元數據項與標準間的關聯映射,采用本方案,通過對算法鏈中的同義詞、分詞、聯想等算法的升級,可以在后期優化提升整體的匹配度,讓自動對標的匹配度得以提高,減少人工操作的工作量,解決了現有方案匹配度低,必須要名稱一致才能匹配,對同義詞無法匹配,且當無法通過名稱匹配時,需要人工進行大量的操作,過程十分繁瑣的問題。
技術領域
本發明涉及數據治理領域,特別涉及一種SQL自動對標的匹配方法及裝置。
背景技術
結構化查詢語言(Structured Query Language)簡稱SQL,是一種特殊目的的編程語言,是一種數據庫查詢和程序設計語言,用于存取數據以及查詢、更新和管理關系數據庫系統。結構化查詢語言是高級的非過程化編程語言,允許用戶在高層數據結構上工作。它不要求用戶指定對數據的存放方法,也不需要用戶了解具體的數據存放方式,所以具有完全不同底層結構的不同數據庫系統, 可以使用相同的結構化查詢語言作為數據輸入與管理的接口。結構化查詢語言語句可以嵌套,這使它具有極大的靈活性和強大的功能。SQL可以獨立完成數據庫生命周期中的全部活動,包括定義關系模式、錄入數據、建立數據庫、査詢、更新、維護、數據庫重構、數據庫安全性控制等一系列操作,這就為數據庫應用系統開發提供了良好的環境,在數據庫投入運行后,還可根據需要隨時逐步修改模式,且不影響數據庫的運行,從而使系統具有良好的可擴充性。
現有的SQL對標方案的操作方式有:第一步,根據數據項的中英文名查詢具有相同名字的代碼,如果有則進行關聯對標;第二步,如果沒有中英文都匹配的代碼則以英文名進行匹配,如果有則進行關聯對標;第三步,如果前兩步關聯失敗,就需要人工指定關聯標準。
上述方法的問題在于匹配度低,必須要名稱一致才能匹配,對同義詞無法匹配,且當無法通過名稱匹配時,需要人工進行大量的操作,過程十分繁瑣。
發明內容
本發明的目的在于:提供了一種SQL自動對標的匹配方法及裝置,解決了現有方案匹配度低,必須要名稱一致才能匹配,對同義詞無法匹配,且當無法通過名稱匹配時,需要人工進行大量的操作,過程十分繁瑣的問題。
本發明采用的技術方案如下:
一種SQL自動對標的匹配方法,包括以下步驟:
S1、讀取數據項的第一名稱,根據第一名稱查詢是否具有相同名稱的標準,如果有則進行關聯對標,如果沒有則轉入步驟S2;
S2、對第一名稱進行識別得到第一名稱的中文部分為第二名稱,得到第一名稱的非中文部分為第三名稱;
S3、根據第二名稱和第三名稱中的任意一項查詢是否具有相同名稱的標準,如果有則進行關聯對標,如果沒有則轉入步驟S4;
S4、根據同義詞庫第一名稱的同義詞查詢是否具有相同名稱的標準,如果有則進行關聯對標,如果沒有則轉入步驟S5;
S5、對第一名稱進行分詞處理后查詢分詞是否具有相同名稱的標準,如果有則進行關聯對標,如果沒有則轉入步驟S6;
S6、根據第一名稱進行人工匹配完成該數據項的關聯對標。
采用上述方案,通過對算法鏈中的同義詞、分詞、聯想等算法的升級,可以在后期優化提升整體的匹配度,讓自動對標的匹配度得以提高,減少人工操作的工作量,解決了現有方案匹配度低,必須要名稱一致才能匹配,對同義詞無法匹配,且當無法通過名稱匹配時,需要人工進行大量的操作,過程十分繁瑣的問題。
進一步的,所述步驟S4中根據第一名稱的同義詞查詢是否具有相同名稱的標準的方法包括以下步驟:
S401、在同義詞庫中查詢第二名稱的同義詞為第四名稱,查詢第三名稱的同義詞為第五名稱;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都四方偉業軟件股份有限公司,未經成都四方偉業軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010674260.2/2.html,轉載請聲明來源鉆瓜專利網。





