[發明專利]一種基于自然語言的知識圖譜構建和完善系統及方法在審
| 申請號: | 202110041012.9 | 申請日: | 2021-01-13 |
| 公開(公告)號: | CN112732938A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 李晉琳 | 申請(專利權)人: | 李晉琳 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06N5/02;G06N5/04;G06F40/151;G06F16/31 |
| 代理公司: | 北京天盾知識產權代理有限公司 11421 | 代理人: | 周東呈 |
| 地址: | 510000 廣東省廣州市天*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 知識 圖譜 構建 完善 系統 方法 | ||
本發明公開了一種基于自然語言的知識圖譜構建和完善系統及方法,包括原始數據庫、數據處理模塊和知識圖譜生成模塊,所述原始數據庫與數理處理模塊通信連接,數據處理模塊與知識圖譜生成模塊通信連接。本發明利用推理模塊接收原始數據庫和數據處理模塊發送的推理規則、知識實體和關系屬性,根據該推理規則、知識實體和關系屬性生成推理知識圖譜,并將該推理知識圖譜發送給知識圖譜生成模塊,知識圖譜生成模塊接收推理模塊發送的推理知識圖譜,將該推理知識圖譜與基礎知識圖譜進行融合,得到融合知識圖譜,從而保證了知識圖譜的時效性,避免了知識圖譜更新過程中,大量的數據處理。
技術領域
本發明涉及知識圖譜構建技術領域,具體是一種基于自然語言的知識圖譜構建和完善方法。
背景技術
目前,知識圖譜中存儲的是有限的和靜態的、包括實體-屬性(或關系)-實體知識三元組,不可避免存在部分知識關聯的缺失。此外,目前知識圖譜的存儲技術忽略了知識的時效性。但是,知識圖譜的應用過程中,需要應用到包含知識圖譜中所描述事實的衍生問題,導致現有的知識三元組無法直接回答用戶提問。例如:“你今年幾歲了?”知識庫中存儲的是某人生日,卻沒有包含與時間有關的動態知識“年齡”。但某個人的“年齡”也在隨著時間變化而增加。由此可知,現有知識圖譜已無法滿足用戶需求。
對于上述問題,目前有以下兩種解決方案:1、在知識三元組的表達中增加狀態的維度。也即在已有的二元關系中,引入第三個關系參數:時間軸。舉例說明,原始的三元組表達二元關系,表示為(e1,r,e2),則增加狀態維度后的知識圖譜中,新的二元關系表達為(e1,r,e2;time)。例如:根據規則在知識庫中聲明一條語句:(小明,年齡,10,expired_time=2020.10.01),在三元組過期后(時間處于過期時間expired_time之后)重新聲明新的有效語句。2、引入虛擬節點以表達知識三元組的時效性,但是引入虛擬節點將導致知識庫結構本身的改變。因此,無論是增加狀態維度后的知識圖譜,還是引入虛擬節點后的知識圖譜,與其它知識圖譜的兼容性都比較差,難以實現知識譜圖之間的整合和互操作。另一方面,由于增加了帶有時態的表達方式來保證知識庫一致性和實時性,很大程度上增加了RDF(Resource Description Framework,資源描述框架)三元組的計算量和復雜度。以上兩種方案中,都不能很好地滿足用戶對知識圖譜的需求。
因此,針對以上現狀,迫切需要開發一種基于自然語言的知識圖譜構建和完善系統及方法,以克服當前實際應用中的不足。
發明內容
本發明的目的在于提供一種基于自然語言的知識圖譜構建和完善系統及方法,以解決上述背景技術中提出的問題。
為實現上述目的,本發明提供如下技術方案:
一種基于自然語言的知識圖譜構建和完善系統,包括原始數據庫、數據處理模塊和知識圖譜生成模塊,所述原始數據庫與數理處理模塊通信連接,數據處理模塊與知識圖譜生成模塊通信連接,其中:
原始數據庫,用于接收用戶輸入的自然語言文本,將該自然語言文本存儲為原始數據,并發送給數據處理模塊;用于獲取知識圖譜更新需要使用的推理規則;
數據處理模塊,用于接收原始數據庫發送的原始數據,對該原始數據進行知識抽取和知識融合,得到原始數據中的知識實體以及各知識實體之間的關系屬性,并將該知識實體和關系屬性發送給知識圖譜生成模塊;
知識圖譜生成模塊,用于接收數據處理模塊發送的知識實體和關系屬性,依據該知識實體和關系屬性建立基礎知識圖譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于李晉琳,未經李晉琳許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110041012.9/2.html,轉載請聲明來源鉆瓜專利網。





