[發明專利]知識圖譜構建方法、裝置、設備和介質有效
| 申請號: | 202010074569.8 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111291205B | 公開(公告)日: | 2023-06-13 |
| 發明(設計)人: | 馮知凡;王海峰;汪琦;朱勇;呂雅娟 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/483 | 分類號: | G06F16/483;G06N3/0464;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 構建 方法 裝置 設備 介質 | ||
1.一種知識圖譜構建方法,其特征在于,包括:
從描述目標事件的目標文本中提取所述目標事件關聯的目標動作以及所述目標動作關聯的目標實體,包括:
將所述目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征;
根據所述目標動作特征和所述目標文本特征,確定目標實體特征;
根據所述目標動作特征和所述目標文本,確定所述目標動作;
根據所述目標實體特征和所述目標文本,確定所述目標實體;
將所述目標動作和所述目標實體作為節點,將所述目標動作和所述目標實體之間的關系作為邊,構建知識圖譜;
其中,所述將所述目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征之前,所述方法還包括:
根據樣本動作在樣本文本中的位置和所述樣本文本的字符數量,確定樣本動作特征;
根據所述樣本文本和所述樣本動作特征,訓練得到所述事件提取模型。
2.根據權利要求1所述的方法,其特征在于,所述根據樣本動作在樣本文本中的位置和所述樣本文本的字符數量,確定樣本動作特征,包括:
根據所述樣本文本的字符數量,確定所述樣本動作特征的列數;
根據樣本動作名稱的首字符在所述樣本文本中的位置,確定所述樣本動作特征中首行元素的數值;
根據所述樣本動作名稱的尾字符在所述樣本文本中的位置,確定所述樣本動作特征中尾行元素的數值。
3.根據權利要求1所述的方法,其特征在于,所述將所述目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征之前,所述方法還包括:
根據樣本事件的關聯詞和/或樣本事件的多模態信息,訓練得到所述事件提取模型,其中所述樣本事件的多模態信息包括圖片形式信息、視頻形式信息、音頻形式信息和文本形式信息中的至少兩種。
4.根據權利要求3所述的方法,其特征在于,所述根據樣本事件的關聯詞,訓練得到所述事件提取模型,包括:
將包括所述關聯詞的樣本事件作為正樣本,將未包括所述關聯詞語的非樣本事件作為負樣本;
利用所述正樣本和所述負樣本對初始模型進行訓練,得到所述事件提取模型。
5.根據權利要求1所述的方法,其特征在于,所述知識圖譜還包括作為節點的主題實體以及作為邊的主題實體之間的上下位關系。
6.根據權利要求1所述的方法,其特征在于,所述知識圖譜中節點的信息形式包括視頻、圖像和音頻中的至少一種。
7.一種知識圖譜構建裝置,其特征在于,包括:
動作提取模塊,用于從描述目標事件的目標文本中提取所述目標事件關聯的目標動作以及所述目標動作關聯的目標實體;
圖譜構建模塊,用于將所述目標動作和所述目標實體作為節點,將所述目標動作和所述目標實體之間的關系作為邊,構建知識圖譜;
其中,所述動作提取模塊,包括:
特征提取單元,用于將所述目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征;
特征確定單元,用于根據所述目標動作特征和所述目標文本特征,確定目標實體特征;
動作確定單元,用于根據所述目標動作特征和所述目標文本,確定所述目標動作;
物體確定單元,用于根據所述目標實體特征和所述目標文本,確定所述目標實體;
其中,所述裝置還包括:
樣本特征確定模塊,用于所述將所述目標文本作為事件提取模型的輸入,得到目標文本特征和目標動作特征之前,根據樣本動作在樣本文本中的位置和所述樣本文本的字符數量,確定樣本動作特征;
模型訓練模塊,用于根據所述樣本文本和所述樣本動作特征,訓練得到所述事件提取模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010074569.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種便于調節的產科醫療護理用注射輸液座椅
- 下一篇:柔性觸控顯示裝置





