[發明專利]一種元信息管理的方法及設備有效
| 申請號: | 201710240996.7 | 申請日: | 2017-04-13 |
| 公開(公告)號: | CN107092671B | 公開(公告)日: | 2019-12-17 |
| 發明(設計)人: | 陸天明;楊俊;劉圣;尹迪 | 申請(專利權)人: | 星環信息科技(上海)有限公司 |
| 主分類號: | G06F16/907 | 分類號: | G06F16/907 |
| 代理公司: | 31243 上海百一領御專利代理事務所(普通合伙) | 代理人: | 佘猛;邵棟 |
| 地址: | 200233 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息管理 方法 設備 | ||
本申請的目的是提供一種元信息管理的方法及設備,本申請通過基于獲取的原始數據判斷是否存在所述原始數據對應的元信息,得到判斷結果;根據所述判斷結果獲取所述元信息,并將所述元信息與所述原始數據進行綁定存儲;通過所述元信息對以與其綁定存儲的原始數據數據作為待執行數據的挖掘操作進行驗證,得到驗證結果;將與所述驗證結果中驗證成功的元信息綁定存儲的原始數據作為執行數據,執行所述數據挖掘操作,生成數據挖掘操作的結果數據集;從而實現原始數據與元信息的靜態綁定,避免了在每個數據挖掘操作都要設置元信息的麻煩,且一份數據只能有一種對應的元信息,無法隨意設置,加強了限制和檢查,降低了用戶操作不當導致錯誤的可能性。
技術領域
本申請涉及計算機領域,尤其涉及一種元信息管理的方法及設備。
背景技術
隨著大數據以及數據挖掘技術的蓬勃發展,越來越多的數據挖掘系統和算法不斷涌現。使用數據挖掘技術,可以更好地預測用戶的行為,提升產品的質量。但是對于許多想要使用數據挖掘的傳統企業和機構而言,較高的入門門檻成為了應用數據挖掘技術的一大障礙,其中一個問題就是,在通過編程語言實現數據挖掘算法時,不僅僅需要提供用于數據挖掘的原始數據,還需要設置許多額外信息,比如設置元信息,而在傳統的數據挖掘系統中,需要在每一個操作中都設置元信息,元信息沒有與數據緊緊綁定,導致了許多重復的操作,增加了數據挖掘系統的使用難度,不完備或不正確的元信息導致數據挖掘算法在執行時出現錯誤,浪費計算資源;同時,對元信息沒有限制,用戶可以隨意設置,易于出錯。
本申請的一個目的是提供一種元信息管理的方法及設備,解決現有技術中對于每個數據挖掘操作都要設置元信息導致的大量重復操作,用戶可隨意設置,易于出錯的問題。
根據本申請的一個方面,提供了一種元信息管理的方法,該方法包括:
基于獲取的原始數據判斷是否存在所述原始數據對應的元信息,得到判斷結果;
根據所述判斷結果獲取所述元信息,并將所述元信息與所述原始數據進行綁定存儲;
通過所述元信息對以與其綁定存儲的原始數據數據作為待執行數據的挖掘操作進行驗證,得到驗證結果;
將與所述驗證結果中驗證成功的元信息綁定存儲的原始數據作為執行數據,執行所述數據挖掘操作,生成數據挖掘操作的結果數據集。
進一步地,根據所述判斷結果獲取所述元信息,包括:
若所述判斷結果為已存在所述原始數據對應的元信息,則從數據庫中讀取所述元信息;
若所述判斷結果為未存在所述原始數據對應的元信息,則推斷所述原始數據對應的元信息。
進一步地,所述推斷所述原始數據對應的元信息包括:
根據所述原始數據的類型和名稱推斷與其對應的元信息。
進一步地,所述將所述元信息與所述原始數據進行綁定存儲包括:
將所述元信息存儲至所述原始數據所在的數據表對應的數據字典中。
進一步地,通過所述元信息對以與其綁定存儲的原始數據數據作為待執行數據的挖掘操作進行驗證,得到驗證結果,包括:
獲取預先設定的所述原始數據的必要元信息;
根據所述必要元信息及與所述原始數據綁定存儲的元信息對數據的挖掘操作進行驗證,得到驗證結果。
進一步地,通過所述元信息對以與其綁定存儲的原始數據數據作為待執行數據的挖掘操作進行驗證,得到驗證結果之后,包括:
若所述驗證結果為驗證失敗,則重新獲取所述原始數據的元信息,并將新獲取的元信息與所述原始數據重新存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于星環信息科技(上海)有限公司,未經星環信息科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710240996.7/2.html,轉載請聲明來源鉆瓜專利網。





