[發明專利]一種面向文獻類數字資源元數據的質量評價方法及系統在審
| 申請號: | 201810707861.1 | 申請日: | 2018-07-02 |
| 公開(公告)號: | CN109299062A | 公開(公告)日: | 2019-02-01 |
| 發明(設計)人: | 胡中貴;劉海日 | 申請(專利權)人: | 北京市天元網絡技術股份有限公司 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06F16/2458;G06F16/28 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 100193 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數字資源 元數據 質量評價 質量評價指標 評價指標 核查結果 構建 權重 核查 | ||
本發明提供一種面向文獻類數字資源元數據的質量評價方法及系統,所述方法包括:S1,根據目標文獻類數字資源的自身屬性,構建所述目標文獻類數字資源中元數據的質量評價指標體系;S2,根據所述質量評價指標體系中的各評價指標,對各所述元數據進行各項核查;S3,根據各項核查結果對應的分數和各所述評價指標的權重,計算所述元數據的總得分。本發明實現了對面向文獻類數字資源元數據的質量評價,且質量評價精度高。
技術領域
本發明屬于圖書館學技術領域,更具體地,涉及一種面向文獻類數字資源元數據的質量評價方法及系統。
背景技術
隨著科學技術的不斷進步發展、全球信息化進程持續推進,文獻類數據資源的數量和體量以前所未有的速度增長。元數據作為描述這些數據資源的重要數據,如何全面系統的檢查和評價資源元數據的質量直接關乎數據后續的使用。
目前對于文獻類數字資源元數據的質量評價缺乏一套相對完整的、全面的、靈活的、可落地的質量評價方法,大多數現存的相關評價方法只是在理論層面進行了闡述,僅僅從分析評價的維度進行介紹,并沒有給出針對文件、記錄和字段屬性的具體評價規則,對文獻類數字資源元數據的質量評價方法的落地實施缺乏實質性的指導意義。
發明內容
為克服上述現有面向文獻類數字資源元數據的質量評價方法只是在理論上進行闡述,無法落地實施的問題或者至少部分地解決上述問題,本發明提供一種面向文獻類數字資源元數據的質量評價方法及系統。
根據本發明的第一方面,提供一種面向文獻類數字資源元數據的質量評價方法,包括:
S1,根據目標文獻類數字資源的自身屬性,構建所述目標文獻類數字資源中元數據的質量評價指標體系;
S2,根據所述質量評價指標體系中的各評價指標,對各所述元數據進行各項核查;
S3,根據各項核查結果對應的分數和各所述評價指標的權重,計算所述元數據的總得分。
具體地,所述質量評價指標體系包括完整性、正確性、一致性、唯一性和時效性中的一種或多種評價指標;
相應地,所述步驟S2具體包括:
根據所述完整性評價指標,核查所述元數據中的數據實體是否缺失、數據文件是否缺失、數據記錄是否缺失、數據結構是否缺失和記錄中字段內容是否缺失中的一種或多種;
根據所述正確性評價指標,核查所述元數據的合法性、有效性、是否存在亂碼和是否存在統一值替代中的一種或多種;
根據所述一致性評價指標,核查所述元數據的數據邏輯一致性和/或內容格式一致性;
根據所述唯一性評價指標,核查所述元數據的數據記錄唯一性和/或關鍵屬性值唯一性;
根據所述時效性指標,核查所述元數據的數據內容新穎性和/或鏈接地址有效性。
具體地,所述步驟S1和S3之間還包括:
根據所述自身屬性所屬的級別,對所述自身屬性對應的元數據進行分類;
相應地,所述步驟S2還包括:
根據每一類所述元數據對應的評價指標,對每一類所述元數據進行核查;
其中,每一類所述元數據與所述評價指標預先關聯存儲。
具體地,根據所述自身屬性所屬的級別,對所述自身屬性對應的元數據進行分類的步驟具體包括:
根據所述自身屬性所屬的級別,將所述自身屬性對應的元數據分為文件級元數據、記錄級元數據和字段級元數據中的一種或多種。
具體地,根據每一類所述元數據對應的評價指標,對每一類所述元數據進行核查的步驟具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市天元網絡技術股份有限公司,未經北京市天元網絡技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810707861.1/2.html,轉載請聲明來源鉆瓜專利網。





