[發明專利]基于知識圖譜表示學習的隱喻計算和裝置有效
| 申請號: | 202110231003.6 | 申請日: | 2021-03-02 |
| 公開(公告)號: | CN113157932B | 公開(公告)日: | 2023-03-28 |
| 發明(設計)人: | 宋巍;郭京津;劉麗珍 | 申請(專利權)人: | 首都師范大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/211;G06F40/289 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 韓海花 |
| 地址: | 100037 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 知識 圖譜 表示 學習 隱喻 計算 裝置 | ||
1.一種基于知識圖譜表示學習的隱喻計算方法,其特征在于,包括以下步驟:
獲取多對本體、屬性和喻體三元組,根據所述多對本體、屬性和喻體三元組構建隱喻知識圖譜;
從語料庫中統計本體概念與屬性信息,和/或,喻體概念與屬性信息之間的共現頻率,根據共現頻率和預設頻率閾值的比較結果,確定外部概念屬性信息集合;
根據所述隱喻知識圖譜確定概念集合和屬性集合,從所述概念集合和所述屬性集合獲取訓練樣本,根據所述訓練樣本和預設第一損失函數訓練隱喻知識圖譜嵌入模型;
計算所述外部概念屬性信息集合中概念屬性對的相關概率,根據所述相關概率和預設第二損失函數訓練概念屬性嵌入模型;
根據所述隱喻知識圖譜嵌入模型、第一權重、所述概念屬性嵌入模型和第二權重生成聯合嵌入模型;
獲取計算請求;其中,所述計算請求包括:待處理語句或概念屬性信息,通過所述聯合嵌入模型對所述計算請求進行處理,獲取計算結果。
2.如權利要求1所述的方法,其特征在于,所述獲取多對本體、屬性和喻體三元組,包括:
從作文語料中獲取多個明喻語句;
對所述多個明喻語句進行標注,獲取所述多對本體、屬性和喻體三元組。
3.如權利要求1所述的方法,其特征在于,所述獲取多對本體、屬性和喻體三元組,包括:
獲取多個待處理語句,對所述多個待處理語句進行分類,獲取多個明喻語句;
通過句子表示編碼器對所述多個明喻語句進行標注,獲取所述多對本體、屬性和喻體三元組。
4.如權利要求1所述的方法,其特征在于,所述從語料庫中統計本體概念與屬性信息,和/或,喻體概念與屬性信息之間的共現頻率,根據共現頻率和預設頻率閾值的比較結果,確定外部概念屬性信息集合,包括:
使用句法分析器從所述語料庫中抽取主語與動詞、動詞與賓語、形容詞與名詞和名詞與動詞模式的多個短語對,并統計所述多個短語對的共現頻率;
在任一短語對的共現頻率大于所述預設頻率閾值,則確定為外部概念屬性信息,所述多個外部概念屬性信息構建成所述外部概念屬性信息集合。
5.如權利要求1所述的方法,其特征在于,所述根據所述隱喻知識圖譜確定概念集合和屬性集合,從所述概念集合和所述屬性集合獲取訓練樣本,根據所述訓練樣本和預設第一損失函數訓練隱喻知識圖譜嵌入模型,包括:
所述隱喻知識圖譜中的三元組為(t,a,s),分數計算函數如下式所示:
f(t,a,s)=-d(t⊥+a,s⊥)+g1(t⊥,a)+g2(s⊥,a) (1)
其中,t為本體,a為共有屬性,s為喻體,d為距離計算方法,通常為L1或L2函數;g1,g2分別為計算屬性與本體、屬性喻體之間的相關性函數,計算公式如下所示:
g1(t,a)=t⊥MtaT, (2)
g2(s,a)=s⊥MsaT (3)
其中,Mt和Ms分別為本體和喻體的映射矩陣;
對于所述隱喻知識圖譜中每個正確三元組,通過替換本體、屬性或喻體來構造對應的錯誤三元組;
通過公式(1)和(2)對所述每個正確三元組和所述每個錯誤三元組進行相關性計算,獲取每個單元組的相關分數,通過所述第一損失函數基于所述相關分數計算所述每個正確三元組與對應的所述每個錯誤三元組之間的誤差,根據所述誤差和預設誤差閾值調整所述隱喻知識圖譜嵌入模型的參數,直到所述誤差小于預設誤差閾值,獲取所述隱喻知識圖譜嵌入模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于首都師范大學,未經首都師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110231003.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:傳送帶能量回收設備
- 下一篇:一種氣體靜壓軸承微間隙氣膜流場觀測裝置





