[發明專利]知識圖譜表示學習模型訓練方法、裝置及電子設備在審
| 申請號: | 202010324229.6 | 申請日: | 2020-04-22 |
| 公開(公告)號: | CN111680109A | 公開(公告)日: | 2020-09-18 |
| 發明(設計)人: | 楊孝輝 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 任亞娟 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 表示 學習 模型 訓練 方法 裝置 電子設備 | ||
本申請提供了一種知識圖譜表示學習模型訓練方法、裝置及電子設備,該方法包括:獲取知識圖譜中的三元組訓練數據;根據三元組訓練數據構建四元組訓練數據,四元組訓練數據包括三元組訓練數據以及三元組訓練數據對應的權重;將四元組訓練數據輸入到預設模型中,對預設模型進行訓練;在預設模型的損失函數的損失函數值小于損失函數閾值時,將訓練后的預設模型確定為知識圖譜表示學習模型??梢?,在訓練知識圖譜表示學習模型時,考慮了不同三元組訓練數據的重要程度,因此,通過訓練好的知識圖譜表示學習模型所提取的頭實體對應的向量,尾實體對應的向量,以及頭實體和尾實體之間的關系對應的向量的準確度較高。
技術領域
本申請涉及知識圖譜和深度學習技術領域,特別是涉及知識圖譜表示學習模型訓練方法、裝置及電子設備。
背景技術
隨著科學技術的快速發展,知識圖譜的構建和應用得到了快速的發展。知識譜圖是由節點和不同類型的邊組成的多關系圖,其中,每個節點代表一個實體,每條邊代表該條邊連接的兩個節點(稱為頭結點和尾節點)之間的關系,即表示頭實體和尾實體通過特定的關系連接在一起。并且,頭實體、尾實體以及關系所組成的三元組訓練數據構成了事實。例如,(姚明,出生于,上海)就是一個事實。
雖然由三元組所構成事實在表示結構化數據方面很有效,但是,由于事實是一條條文本數據,因此,在實際應用中,對由三元組所構成的事實較難操作,為此,知識圖譜表示學習應用而生,知識圖譜的目的是將頭實體、尾實體以及關系轉化為向量。
發明人在實現本發明的過程中發現:相關技術中,知識圖譜表示學習方法在將頭實體、尾實體以及關系轉化為向量時,對于每個事實或者實體,都是同等對待的。但是,在實際的應用場景中,不同事實或者實體的重要性是不一樣。因此,利用相關技術的技術方案,轉化所得的頭實體對應的向量,尾實體對應的向量,以及關系對應的向量的準確度較低。
發明內容
為了解決相關技術中存在的轉化所得的頭實體對應的向量,尾實體對應的向量,以及關系對應的向量的準確度較低的技術問題,本申請提供了知識圖譜表示學習模型訓練方法、裝置及電子設備。
第一方面,本申請實施例提供了一種知識圖譜表示學習模型訓練方法,所述方法包括:
獲取知識圖譜中的三元組訓練數據,所述三元組訓練數據包括頭實體,尾實體,以及頭實體和尾實體之間的關系;
根據所述三元組訓練數據構建四元組訓練數據,所述四元組訓練數據包括所述三元組訓練數據以及所述三元組訓練數據對應的權重,所述三元組訓練數據對應的權重用于表征所述三元組訓練數據的重要程度;
將所述四元組訓練數據輸入到預設模型中,對所述預設模型進行訓練,其中,在訓練所述預設模型的過程中,所述預設模型提取所述頭實體對應的向量,所述尾實體對應的向量,以及所述頭實體和尾實體之間的關系對應的向量;
在所述預設模型的損失函數的損失函數值小于損失函數閾值時,將訓練后的預設模型確定為知識圖譜表示學習模型。
可選地,所述根據所述三元組訓練數據構建四元組訓練數據,包括:
統計知識圖譜中的三元組訓練數據中尾實體的數量;
根據尾實體的數量所在的數量區間對尾實體進行分組,得到尾實體分組,其中,尾實體的數量在同一數量區間的尾實體被分為同一尾實體分組;
基于數量區間的區間值大小確定對應的尾實體分組的權重,其中,一個數量區間的區間值越小,該數量區間對應的尾實體分組的權重越大;
對于每一尾實體分組,將所述尾實體分組的權重,確定為所述尾實體分組所包括的各個尾實體的三元組訓練數據對應的權重;
將三元組訓練數據以及三元組訓練數據對應的權重確定為四元組訓練數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010324229.6/2.html,轉載請聲明來源鉆瓜專利網。





