[發明專利]知識圖譜的構建方法及裝置、存儲介質、電子設備有效
| 申請號: | 202010066621.5 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111241212B | 公開(公告)日: | 2023-10-24 |
| 發明(設計)人: | 李慧;許蕾;郝吉芳;楊卓士;商曉健;王炳乾 | 申請(專利權)人: | 京東方科技集團股份有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/36;G06F16/215;G06F40/242;G06F40/289 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王輝;闞梓瑄 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 構建 方法 裝置 存儲 介質 電子設備 | ||
1.一種藝術領域知識圖譜的構建方法,其特征在于,所述方法包括:
對內部藝術數據源和外部藝術數據源中的結構化數據進行第一預處理,生成第一結構化數據;
對所述內部藝術數據源和所述外部藝術數據源中的非結構化數據和半結構化數據進行第二預處理得到第二結構化數據;
將所述第一結構化數據與所述第二結構化數據進行融合處理,生成融合藝術數據;其中,所述融合藝術數據包括藝術實體以及與所述藝術實體對應的藝術關系;
根據所述藝術實體和所述藝術關系生成藝術三元組,并根據所述藝術三元組生成藝術領域知識圖譜。
2.根據權利要求1所述的藝術領域知識圖譜的構建方法,其特征在于,所述對內部藝術數據源和外部藝術數據源中的結構化數據進行第一預處理,生成第一結構化數據,包括:
對內部藝術數據源和外部藝術數據源中的結構化數據進行數據清洗;
對所述內部藝術數據源和外部藝術數據源中的結構化數據的數據清洗結果進行重復性檢驗,生成重復性檢驗數據;
根據所述重復性檢驗數據生成數據字典和糾錯字典,基于所述數據字典得到第一結構化數據。
3.根據權利要求2所述的藝術領域知識圖譜的構建方法,其特征在于,所述對內部藝術數據源和外部藝術數據源中的結構化數據進行數據清洗,包括:
對內部藝術數據源和外部藝術數據源中的結構化數據進行單值屬性判定處理,以得到單值結構化數據;
獲取所述單值結構化數據中的第一結構化實體和第一結構化關系,并統計所述單值屬性判定處理的結果得到多值數據表;
若所述多值數據表中未包含多值數據,將所述第一結構化實體和第一結構化關系作為數據清洗結果;
若所述多值數據表中包含多值數據,根據所述多值數據表得到第二結構化實體和第二結構化關系,以作為數據清洗結果。
4.根據權利要求3所述的藝術領域知識圖譜的構建方法,其特征在于,所述根據所述多值數據表得到第二結構化實體和第二結構化關系,以作為數據清洗結果,包括:
根據所述多值數據表更新數據字典或糾錯字典;
根據更新后的數據字典或糾錯字典的更新結果,得到第二結構化實體和第二結構化關系作為數據清洗結果。
5.根據權利要求4所述的藝術領域知識圖譜的構建方法,其特征在于,所述對所述結構化數據的數據清洗結果進行重復性檢驗,生成重復性檢驗數據,包括:
對所述內部藝術數據源和外部藝術數據源中的結構化數據的數據清洗結果進行藝術品實體的重復性檢驗,生成藝術品重復性檢驗結果;
若所述藝術品重復性檢驗結果為相同,對所述數據清洗結果進行藝術家實體的重復性檢驗,生成藝術家重復性檢驗結果;
若所述藝術家重復性檢驗結果為相同,對所述數據清洗結果進行創作時間實體的重復性檢驗,生成創作時間重復性檢驗結果;
若所述創作時間重復性檢驗結果為相同,確定所述藝術品實體為重復藝術品;
對所述重復藝術品進行融合處理,并根據審核通過的融合處理結果生成重復性檢驗數據。
6.根據權利要求5所述的藝術領域知識圖譜的構建方法,其特征在于,所述方法還包括:
若所述藝術家重復性檢驗結果為不同或所述創作時間重復性檢驗結果為不同,確定所述藝術品實體為重名藝術品;
對所述重名藝術品進行去重處理,并根據去重處理結果生成所述重復性檢驗數據。
7.根據權利要求1所述的藝術領域知識圖譜的構建方法,其特征在于,所述第一結構化數據包括目標藝術品數據、目標藝術家數據和目標藝術機構數據;
所述將所述第一結構化數據與所述第二結構化數據進行融合處理,生成融合藝術數據,包括:
將所述第二結構化數據中的參考藝術家數據與所述目標藝術家數據進行融合處理,生成融合藝術家數據;
將所述第二結構化數據中的參考藝術品數據與所述目標藝術品數據進行融合處理,生成融合藝術品數據;
將所述第二結構化數據中的參考藝術機構數據與所述目標藝術機構數據進行融合處理,生成融合藝術機構數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東方科技集團股份有限公司,未經京東方科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010066621.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種煤礦帷幕注漿方法
- 下一篇:一種全自動魚類篩分系統及篩分方法





