[發明專利]基于圖書館的知識圖譜構建方法、碎片化知識生成方法在審
| 申請號: | 202011240896.2 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112434168A | 公開(公告)日: | 2021-03-02 |
| 發明(設計)人: | 劉宇航 | 申請(專利權)人: | 廣西壯族自治區圖書館 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/31;G06F16/332 |
| 代理公司: | 深圳市六加知識產權代理有限公司 44372 | 代理人: | 江曉蘇 |
| 地址: | 530022 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖書館 知識 圖譜 構建 方法 碎片 生成 | ||
本發明涉及大數據和人工智能技術領域,特別涉及一種基于圖書館的知識圖譜構建方法、碎片化知識生成方法和電子設備。該方法包括:獲取數字文獻資源;從該數字文獻資源中提取元數據,根據該元數據生成元數據圖譜;根據該元數據獲取對象數據,并根據該對象數據生成對象數據圖譜;融合該元數據圖譜和該對象數據圖譜,以生成知識圖譜;最后可以根據數字文獻資源和該知識圖譜生成該知識圖譜各知識點的碎片化知識,并可以根據用戶輸入的關鍵詞檢索到知識圖譜的相關知識點,輸出碎片化知識。本發明能夠建立一個完整的知識體系,并基于該知識體系實現碎片化知識的輸出和輸出知識的溯源,能夠滿足用戶的不同需求,提升了圖書館的服務效能。
技術領域
本發明涉及大數據和人工智能技術領域,特別涉及一種基于圖書館的知識圖譜構建方法、碎片化知識生成方法和電子設備。
背景技術
在新時代多行業融合發展,以及移動應用深度融入生活、工作和學習的背景下。圖書館傳統的數字資源服務手段以提供文獻的檢索、下載為主,以擴大服務群體覆蓋面和豐富數字資源種類為提升的手段。然而,這些方式已無法滿足服務由表層應用轉換成深度應用、用戶由深度閱讀轉換成碎片化閱讀的需求。
隨著國家標準化管理委員會、中央網信辦、國家發展改革委、科技部、工業和信息化部等五部門聯合印發《國家新一代人工智能標準體系建設指南》,將人工智能的應用推廣帶到一個新的高度,使得圖書館由傳統的數字資源服務方式轉變成知識體系輸出成為可能。圖書館現存的數字資源將重新進行整合,提供碎片化的輸出以適應各行業的需求,同時碎片化的知識支持溯源回歸達到系統獲取目的,提升圖書館的服務效能。
發明內容
本發明實施方式主要解決的技術問題是提供一種基于圖書館的知識圖譜構建方法、碎片化知識生成方法和電子設備,以實現圖書館能夠以知識體系的形式輸出,并滿足碎片化知識的溯源回歸。
為解決上述技術問題,本發明實施方式采用的一個技術方案是:提供一種基于圖書館的知識圖譜構建方法,所述方法包括:
獲取數字文獻資源;
從所述數字文獻資源中提取元數據,根據所述元數據生成元數據圖譜;
根據所述元數據獲取對象數據,并根據所述對象數據生成對象數據圖譜;
融合所述元數據圖譜和所述對象數據圖譜,以生成知識圖譜。
可選地,所述從所述數字文獻資源中提取元數據,根據所述元數據生成元數據圖譜,包括:
提取元數據,并生成所述元數據對應的第一溯源編號;
將所述元數據進行分詞處理,識別出實體、關系詞和感情詞,基于所述實體、所述關系詞和所述感情詞構建第一SPO三元組,所述第一SPO三元組包括其對應的所述第一溯源編號。
可選地,所述根據所述元數據獲取對象數據,并根據所述對象數據生成對象數據圖譜,包括:
根據所述元數據包含的地址元素獲取所述元數據對應的對象數據;
獲取所述對象數據的類型;
在所述對象數據為文本類型時,對所述對象數據進行分詞處理,識別出實體、關系詞和感情詞;
生成所述實體、所述關系詞和所述感情詞對應的第二溯源編號;
基于所述實體、所述關系詞和所述感情詞構建第二SPO三元組,所述第二SPO三元組中的每一所述實體、所述關系詞和所述感情詞包括其對應的所述第二溯源編號。
可選地,所述方法還包括:
在所述對象數據為視頻和/或音頻類型時,將所述對象數據轉換為文本類型,并基于轉換后的所述對象數據執行所述根據所述對象數據生成對象數據圖譜的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西壯族自治區圖書館,未經廣西壯族自治區圖書館許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011240896.2/2.html,轉載請聲明來源鉆瓜專利網。





