[發明專利]基于圖書館的知識圖譜構建方法、碎片化知識生成方法在審
| 申請號: | 202011240896.2 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112434168A | 公開(公告)日: | 2021-03-02 |
| 發明(設計)人: | 劉宇航 | 申請(專利權)人: | 廣西壯族自治區圖書館 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/31;G06F16/332 |
| 代理公司: | 深圳市六加知識產權代理有限公司 44372 | 代理人: | 江曉蘇 |
| 地址: | 530022 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖書館 知識 圖譜 構建 方法 碎片 生成 | ||
1.一種基于圖書館的知識圖譜構建方法,其特征在于,所述方法包括:
獲取數字文獻資源;
從所述數字文獻資源中提取元數據,根據所述元數據生成元數據圖譜;
根據所述元數據獲取對象數據,并根據所述對象數據生成對象數據圖譜;
融合所述元數據圖譜和所述對象數據圖譜,以生成知識圖譜。
2.根據權利要求1所述的方法,其特征在于,所述從所述數字文獻資源中提取元數據,根據所述元數據生成元數據圖譜,包括:
提取元數據,并生成所述元數據對應的第一溯源編號;
將所述元數據進行分詞處理,識別出實體、關系詞和感情詞,基于所述實體、所述關系詞和所述感情詞構建第一SPO三元組,所述第一SPO三元組包括其對應的所述第一溯源編號。
3.根據權利要求2所述的方法,其特征在于,所述根據所述元數據獲取對象數據,并根據所述對象數據生成對象數據圖譜,包括:
根據所述元數據包含的地址元素獲取所述元數據對應的對象數據;
獲取所述對象數據的類型;
在所述對象數據為文本類型時,對所述對象數據進行分詞處理,識別出實體、關系詞和感情詞;
生成所述實體、所述關系詞和所述感情詞對應的第二溯源編號;
基于所述實體、所述關系詞和所述感情詞構建第二SPO三元組,所述第二SPO三元組中的每一所述實體、所述關系詞和所述感情詞包括其對應的所述第二溯源編號。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
在所述對象數據為視頻和/或音頻類型時,將所述對象數據轉換為文本類型,并基于轉換后的所述對象數據執行所述根據所述對象數據生成對象數據圖譜的步驟。
5.根據權利要求3所述的方法,其特征在于,所述融合所述元數據圖譜和所述對象數據圖譜,以生成知識圖譜,包括:
根據所述第一SPO三元組,關聯包含相同關系的所述第一SPO三元組,以生成目錄集合,所述目錄集合由多個所述第一SPO三元組構成;
根據所述第一溯源編號和所述第二溯源編號將所述目錄集合中的第一SPO三元組與所述第二SPO三元組關聯,以生成知識圖譜。
6.根據權利要求1至5任一項所述的方法,其特征在于,所述方法還包括:
將采集的圖片與所述知識圖譜進行關聯。
7.一種碎片化知識生成方法,其特征在于,所述方法包括:
遍歷所有生成的第一溯源編號,其中,所述第一溯源編號是根據權利要求2所述的基于圖書館的知識圖譜構建方法獲得的;
根據所述第一溯源編號對應的數字資源文獻內容,生成與所述第一溯源編號相對應的碎片化知識。
8.一種碎片化知識生成方法,其特征在于,所述方法包括:
獲取用戶輸入的信息,所述信息包括關鍵詞、圖片和音頻;
在所述信息為關鍵詞時,根據所述關鍵詞檢索知識圖譜,以獲得所述關鍵詞在所述知識圖譜中對應的知識點的第一溯源編號,根據所述第一溯源編號對應的數字資源文獻內容,生成所述第一溯源編號對應的碎片化知識;
在所述信息為圖片時,基于圖像識別獲得所述圖片對應的關鍵詞,根據所述關鍵詞檢索知識圖譜,以獲得所述關鍵詞在所述知識圖譜中對應的知識點的第一溯源編號,根據所述第一溯源編號對應的數字資源文獻內容,生成所述第一溯源編號對應的碎片化知識;
在所述信息為音頻時,基于音頻識別獲得所述音頻對應的關鍵詞,根據所述關鍵詞檢索知識圖譜,以獲得所述關鍵詞在所述知識圖譜中對應的知識點的第一溯源編號,根據所述第一溯源編號對應的數字資源文獻內容,生成所述第一溯源編號對應的碎片化知識;
其中,所述知識圖譜是根據權利要求1至6任一項所述的基于圖書館的知識圖譜構建方法獲得的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西壯族自治區圖書館,未經廣西壯族自治區圖書館許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011240896.2/1.html,轉載請聲明來源鉆瓜專利網。





