[發明專利]人物關系挖掘模型的訓練方法、人物關系挖掘方法及裝置有效
| 申請號: | 202110682820.3 | 申請日: | 2021-06-21 |
| 公開(公告)號: | CN113254549B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 陳愷;李愛平;賈焰;周斌;王曄;涂宏魁;江榮;喻承;徐錫山;宋怡晨;趙曉娟;李晨晨;馬鍶霞;于晗;汪天翔;尚穎丹;林昌建 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/36;G06N5/02 |
| 代理公司: | 北京隆源天恒知識產權代理有限公司 11473 | 代理人: | 陳雪飛 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人物 關系 挖掘 模型 訓練 方法 裝置 | ||
1.一種人物關系挖掘模型的訓練方法,其特征在于,包括:
獲取預先建立的關于人物關系的時空知識圖譜,所述時空知識圖譜包括多個正樣本;
根據所述正樣本進行隨機采樣,生成負樣本,并分別確定各個所述正樣本和各個所述負樣本的頭實體初始嵌入、關系初始嵌入、尾實體初始嵌入和時間嵌入;
根據所述時間嵌入分別對所述頭實體初始嵌入和所述尾實體初始嵌入進行向量旋轉,包括:將所述頭實體初始嵌入左乘所述時間嵌入,并右乘所述時間嵌入的逆,獲得頭實體四元數嵌入,將所述尾實體初始嵌入左乘所述時間嵌入,并右乘所述時間嵌入的逆,獲得尾實體四元數嵌入;
將所述正樣本和所述負樣本中的所述頭實體初始嵌入和所述尾實體初始嵌入分別替換為對應的所述頭實體四元數嵌入和所述尾實體四元數嵌入,獲得處理后的正樣本和處理后的負樣本;
采用所述處理后的正樣本和所述處理后的負樣本迭代訓練預先建立的人物關系挖掘模型至收斂。
2.根據權利要求1所述的人物關系挖掘模型的訓練方法,其特征在于,所述采用所述處理后的正樣本和所述處理后的負樣本迭代訓練預先建立的人物關系挖掘模型至收斂包括:
對所述尾實體四元數嵌入進行共軛運算,獲得尾實體四元數嵌入的共軛嵌入;
將所述頭實體四元數嵌入、所述尾實體四元數嵌入的共軛嵌入和所述關系初始嵌入輸入人物關系挖掘模型的得分函數,采用所述得分函數分別對所述正樣本和所述負樣本打分,獲得正樣本的得分值和負樣本的得分值;
將所述正樣本的得分值和所述負樣本的得分值輸入人物關系挖掘模型的損失函數,通過最小化損失函數優化所述人物關系挖掘模型。
3.根據權利要求2所述的人物關系挖掘模型的訓練方法,其特征在于,所述得分函數包括:
,
其中,為樣本的得分值,為任一正樣本或負樣本,表示時刻的所述頭實體四元數嵌入,表示所述關系初始嵌入,表示時刻的所述尾實體四元數嵌入的共軛嵌入。
4.根據權利要求1至3任一項所述的人物關系挖掘模型的訓練方法,其特征在于,所述獲取預先建立的關于人物關系的時空知識圖譜之前,包括:
獲取關于人物關系的初始數據;
對所述初始數據進行命名實體識別,獲得實體,并對所述初始數據進行關系抽取,獲得實體間的關系;
根據所述實體和所述實體間的關系構建所述時空知識圖譜。
5.根據權利要求1至3任一項所述的人物關系挖掘模型的訓練方法,其特征在于,所述根據所述正樣本進行隨機采樣包括:
對于任意一個所述正樣本,從實體集中隨機選擇一個實體替換所述正樣本的頭實體或尾實體,獲得一個所述負樣本,其中,所述實體集包括所有的所述頭實體和所述尾實體。
6.一種人物關系挖掘方法,其特征在于,包括:
獲取三個初始元素,所述初始元素包括第一人物、第二人物、關系和時間中的任意三個;
將缺失的元素對應的集合中的各個元素分別作為待定元素與三個所述初始元素組成四元組,其中,所述四元組包括所述第一人物、所述第二人物、所述關系和所述時間;
對各個所述四元組進行預處理,獲得處理后的四元組;
將各個所述處理后的四元組分別輸入訓練好的人物關系挖掘模型,采用打分函數對各個所述處理后的四元組進行打分,確定各個所述待定元素的得分值,其中,所述人物關系挖掘模型采用如權利要求1至5任一項所述的人物關系挖掘模型的訓練方法訓練得到;
根據各個所述待定元素的得分值確定挖掘的信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110682820.3/1.html,轉載請聲明來源鉆瓜專利網。





