[發明專利]知識圖譜中三元組置信度計算方法和裝置有效
| 申請號: | 202010041594.6 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111291192B | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 李艦;李雙婕;史亞冰;蔣燁;張揚;朱勇 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/33 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 戎鄭華 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 三元 置信 計算方法 裝置 | ||
本申請公開了知識圖譜中三元組置信度計算方法和裝置,涉及人工智能領域,方法包括:根據知識圖譜中待計算的目標三元組,確定待搜索的查詢語句;獲取與查詢語句對應的各網頁文本;根據第一主體、第一客體及第一關系,在每個網頁文本中出現的順序,確定目標三元組的各第一特征;利用預設的字符,替換每個網頁文本中第一主體、第一客體及第一關系,以根據生成的字符串確定目標三元組的各第二特征;根據目標三元組的各第一特征及各第二個特征,分別與預設的模版空間中各規則模版間的相似度,確定目標三元組的置信度。該方法通過利用預設的模版空間的各規則模版,對三元組置信度進行多維度校驗,以此挖掘高質量的三元組,既不受挖掘源限制也無需人工參與。
技術領域
本申請涉及計算機技術領域,具體涉及人工智能領域,尤其涉及一種知識圖譜中三元組置信度計算方法和裝置。
背景技術
知識圖譜中的三元組(包括主體、客體、主體與客體之間的關系)在實體問答、實體推薦等各應用場景中有著重要的作用。三元組的準確性直接影響各應用的準確性。目前,為了提高三元組的準確性,通常通過對挖掘源的質量進行控制,或者由人工對全量數據進行標注、挖掘的方法。
但是,由于高質量的挖掘源數量有限,因此限制挖掘源會直接影響知識圖譜的覆蓋率,而通過人工的方式進行標注、挖掘,標注成本高。
發明內容
本申請提出一種知識圖譜中三元組置信度計算方法和裝置,用于解決相關技術中,通過控制挖掘源的質量或者人工方式提高三元組的準確性的方法,存在知識圖譜覆蓋率低、人工標注成本高的問題。
本申請一方面實施例提出了一種知識圖譜中三元組置信度計算方法,包括:
根據知識圖譜中待計算的目標三元組,確定待搜索的查詢語句,其中,目標三元組中包括第一主體、第一客體及第一關系;
獲取與所述查詢語句對應的各網頁文本;
根據所述第一主體、第一客體及第一關系,在每個網頁文本中出現的順序,確定所述目標三元組的各第一特征;
利用預設的字符,替換每個網頁文本中第一主體、第一客體及第一關系,以根據生成的字符串確定所述目標三元組的各第二特征;
根據所述目標三元組的各第一特征及各第二個特征,分別與預設的模版空間中各規則模版間的相似度,確定所述目標三元組的置信度。
本申請實施例的知識圖譜中三元組置信度計算方法,通過首先根據知識圖譜中待計算的目標三元組,確定待搜索的查詢語句,其中,目標三元組中包括第一主體、第一客體及第一關系,然后獲取與查詢語句對應的各網頁文本,之后根據第一主體、第一客體及第一關系,在每個網頁文本中出現的順序,確定目標三元組的各第一特征,利用預設的字符,替換每個網頁文本中第一主體、第一客體及第一關系,以根據生成的字符串確定目標三元組的各第二特征,再根據目標三元組的各第一特征及各第二個特征,分別與預設的模版空間中各規則模版間的相似度,確定目標三元組的置信度。由此,通過根據網絡搜索結果得到的特征,和根據預設的字符替換后生成的字符串得到特征,利用預設的模版空間的各規則模版,對知識圖譜中三元組的置信度進行多維度校驗,以此可挖掘高質量的三元組,不僅不受挖掘源的限制,提高了知識圖譜的覆蓋率,而且無需人工參與,降低了三元組的挖掘成本。
本申請另一方面實施例提出了一種知識圖譜中三元組置信度計算裝置,包括:
第一確定模塊,用于根據知識圖譜中待計算的目標三元組,確定待搜索的查詢語句,其中,目標三元組中包括第一主體、第一客體及第一關系;
第一獲取模塊,用于獲取與所述查詢語句對應的各網頁文本;
第二確定模塊,永不根據所述第一主體、第一客體及第一關系,在每個網頁文本中出現的順序,確定所述目標三元組的各第一特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010041594.6/2.html,轉載請聲明來源鉆瓜專利網。





