[發(fā)明專利]知識圖譜挖掘的方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110678441.7 | 申請日: | 2021-06-18 |
| 公開(公告)號: | CN113553439A | 公開(公告)日: | 2021-10-26 |
| 發(fā)明(設計)人: | 高鵬;郝少春;袁蘭;吳飛;周偉華;高峰;潘晶 | 申請(專利權)人: | 杭州摸象大數據科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/211;G06F40/232;G06F40/295 |
| 代理公司: | 杭州創(chuàng)智卓英知識產權代理事務所(普通合伙) 33324 | 代理人: | 張超 |
| 地址: | 310000 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 挖掘 方法 系統(tǒng) | ||
本申請涉及一種知識圖譜挖掘的方法和系統(tǒng),該知識圖譜挖掘的方法包括:獲取文本,并對文本進行糾錯處理;根據預設的詞表,對糾錯處理后的文本進行分詞和詞性標注處理,得到文本中的字詞和字詞的詞性;根據字詞和詞性,識別文本中的實體,并根據字詞、詞性和實體,抽取文本中的實體的屬性和關系;根據實體,進行實體鏈接,并根據實體鏈接的結果、實體的屬性和關系,進行知識融合,得到知識圖譜,通過本申請,解決了相關技術中知識圖譜的知識更新存在較大的滯后性的問題,達到了及時更新知識圖譜的知識的效果。
技術領域
本申請涉及人工智能技術領域,特別是涉及一種知識圖譜挖掘的方法和系統(tǒng)。
背景技術
知識圖譜(Knowledge Graph)在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發(fā)展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯(lián)系,已經廣泛應用于問答、搜索、推薦等多個領域。
在相關技術中,知識圖譜挖掘過程需要人工參與,知識圖譜挖掘是通過離線對信息進行挖掘,得到新知識,再通過定時的方式,更新該新知識至知識圖譜的存儲內容中,這導致知識圖譜的知識更新存在較大的滯后性,例如,在智能機器人對話場景中,用戶經常會提到很多新的知識,由于智能機器人的系統(tǒng)內的知識圖譜未存儲該部分知識,用戶再次提到該知識時,智能機器人依然無法對該知識進行識別,直到該智能機器人被定時更新,獲得該知識。
針對相關技術中,知識圖譜的知識更新存在較大的滯后性的問題,尚未提出有效的解決方案。
發(fā)明內容
本申請實施例提供了一種知識圖譜挖掘的方法和系統(tǒng),以至少解決相關技術中知識圖譜的知識更新存在較大的滯后性的問題。
第一方面,本申請實施例提供了一種知識圖譜挖掘的方法,所述方法包括:
獲取文本,并對所述文本進行糾錯處理;
根據預設的詞表,對糾錯處理后的所述文本進行分詞和詞性標注處理,得到所述文本中的字詞和所述字詞的詞性;
根據所述字詞和所述詞性,識別所述文本中的實體,并根據所述字詞、所述詞性和所述實體,抽取所述文本中的所述實體的屬性和關系;
根據所述實體,進行實體鏈接,并根據所述實體鏈接的結果、所述實體的所述屬性和所述關系,進行知識融合,得到知識圖譜。
在其中一些實施例中,所述詞表的構建過程包括:
采用多個詞性標注工具,并將多個所述詞性標注工具中的詞性均配置為目標詞性標注集中的詞性;
獲取構建詞表的基礎數據,并對所述基礎數據進行分句,輸入分句后的所述基礎數據至多個所述詞性標注工具中,得到標注結果,其中,所述標注結果包括所述基礎數據的字詞和所述字詞的詞性;
在至少兩個所述標注工具得到的所述標注結果相同的情況下,記錄所述標注結果,并統(tǒng)計所述標注結果出現的頻次,根據所述標注結果和所述頻次,生成所述詞表。
在其中一些實施例中,所述實體的識別過程包括:
分別通過詞典和識別模型進行實體識別;
在所述詞典的識別結果和所述識別模型的識別結果相同的情況下,采用該識別結果中的實體詞;
在所述詞典的識別結果為空,且所述識別模型的識別結果的置信度達到置信度閾值的情況下,保存所述識別模型的識別結果中的實體詞和所述實體詞的關聯(lián)信息,其中,所述關聯(lián)信息包括所述實體詞所在的對話語句。
在其中一些實施例中,所述實體的屬性和關系的抽取過程包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州摸象大數據科技有限公司,未經杭州摸象大數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110678441.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種清渣機全防護機罩
- 下一篇:一種深層快速降水動力固結裝置及方法





