[發(fā)明專利]一種基于知識圖譜技術的數(shù)據(jù)智能分級方法有效
| 申請?zhí)枺?/td> | 202210834822.4 | 申請日: | 2022-07-15 |
| 公開(公告)號: | CN115374106B | 公開(公告)日: | 2023-05-26 |
| 發(fā)明(設計)人: | 金震;張京日;穆宇浩 | 申請(專利權)人: | 北京三維天地科技股份有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/36;G06F18/23213;G06F16/28;G06N3/04;G06N5/02 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 張樹朋 |
| 地址: | 100000 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 技術 數(shù)據(jù) 智能 分級 方法 | ||
1.一種基于知識圖譜技術的數(shù)據(jù)智能分級方法,其特征在于,包括:
S1:獲取數(shù)據(jù)物理表之間的血緣關系,根據(jù)血緣關系生成數(shù)據(jù)物理表知識圖譜;
S2:利用改進的特征向量中心性算法,計算數(shù)據(jù)物理表知識圖譜中物理表的網(wǎng)絡權重;
S3:獲取兩個特征數(shù)據(jù)集,兩個特征數(shù)據(jù)集為:數(shù)據(jù)物理表的數(shù)據(jù)訪問情況數(shù)據(jù)集和數(shù)據(jù)更新頻率數(shù)據(jù)集,基于K-means聚類算法對所述兩個特征數(shù)據(jù)集進行聚類分析,生成聚類分析結果;
S4:根據(jù)聚類分析結果和網(wǎng)絡權重,基于層次分析法和熵權法,構建數(shù)據(jù)物理表重要度評估公式;
S5:利用數(shù)據(jù)物理表重要度評估公式對數(shù)據(jù)物理表進行評估,根據(jù)評估結果獲得核心關鍵數(shù)據(jù);
S4包括:
S401:基于聚類分析結果和網(wǎng)絡權重,構建數(shù)據(jù)物理表的重要度評估指標;
S402:通過層次分析法計算獲得重要度評估指標的主觀權重;
S403:通過熵權法計算獲得重要度評估指標的客觀權重;
S404:根據(jù)主觀權重和客觀權重,生成重要度評估指標的復合權重,基于復合權重,生成數(shù)據(jù)物理表的重要度評估公式。
2.根據(jù)權利要求1所述的一種基于知識圖譜技術的數(shù)據(jù)智能分級方法,其特征在于,S1包括:構建第一本體模型,基于第一本體模型生成數(shù)據(jù)物理表的知識圖譜;所述構建第一本體模型的方法包括:
S101:獲取用于創(chuàng)建數(shù)據(jù)物理表知識圖譜的本體模型;
S102:基于預設的本體模型質量評價條件對本體模型進行評價;所述本體模型質量評價條件基于數(shù)據(jù)的完整性、簡潔性、清晰性和可用性制定;
S103:篩選出評價結果符合預設評價結果閾值的第一本體模型。
3.根據(jù)權利要求2所述的一種基于知識圖譜技術的數(shù)據(jù)智能分級方法,其特征在于,S1包括:
S104:解析數(shù)據(jù)物理表之間的血緣關系,獲取血緣關系的特征類別;
S105:選取所述特征類別中的歸屬性、層次性、多源性特征,基于預設的關系抽取模型進行關系抽取,獲得數(shù)據(jù)物理表的實體關系;
S106:將數(shù)據(jù)物理表、數(shù)據(jù)物理表的實體關系輸入第一本體模型,生成數(shù)據(jù)物理表的知識圖譜。
4.根據(jù)權利要求1所述的一種基于知識圖譜技術的數(shù)據(jù)智能分級方法,其特征在于,S2包括:
S201:采用改進的特征向量中心性算法對數(shù)據(jù)物理表知識圖譜中的實體節(jié)點進行重要度分析;所述改進的特征向量中心性算法為基于加權的PageRank算法;
S202:獲取實體節(jié)點的重要度數(shù)組、節(jié)點總數(shù)、阻尼系數(shù)和收斂門限,并進行初始化賦值;
S203:根據(jù)初始化賦值,計算實體節(jié)點的出弧計數(shù)矩陣、出弧權重和矩陣;
S204:對實體節(jié)點重要度進行迭代計算,獲得連續(xù)兩次的重要度數(shù)組值,計算獲得連續(xù)兩次的重要度數(shù)組值的差值;
S205:將所述差值的正無窮范數(shù)與收斂門限進行比較,若所述正無窮范數(shù)小于收斂門限,則迭代結束,獲得排序后的重要度矩陣;
S206:基于排序后的重要度矩陣,獲得數(shù)據(jù)物理表知識圖譜物理表的網(wǎng)絡權重。
5.根據(jù)權利要求1所述的一種基于知識圖譜技術的數(shù)據(jù)智能分級方法,其特征在于,S3包括:
S301:獲取數(shù)據(jù)物理表的數(shù)據(jù)訪問情況特征數(shù)據(jù)集、數(shù)據(jù)更新頻率特征數(shù)據(jù)集,將數(shù)據(jù)訪問情況特征數(shù)據(jù)集、數(shù)據(jù)更新頻率特征數(shù)據(jù)集分別劃分為訓練集和驗證集,并設置P個初始聚類中心;
S302:獲取訓練集中的每一個樣本,計算其與每一個質心的距離,并將其劃分到距離最近的質心所屬集合;
S303:重新計算每個集合的質心,并計算新的質心與原來質心的第一距離;
S304:若所述第一距離小于預設的距離閾值,則終止聚類,獲得P個聚類質心;
S305:若所述第一距離大于預設的距離閾值,則重復步驟S302至S304;
S306:獲取測試集中的每一個樣本,計算其與P個簇的質心的距離,將所述距離轉換成相應的分值進行結果輸出,得到聚類分析結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三維天地科技股份有限公司,未經(jīng)北京三維天地科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210834822.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





