[發(fā)明專利]基于關(guān)系路徑的遠(yuǎn)程監(jiān)督關(guān)系抽取方法、裝置及介質(zhì)有效
| 申請?zhí)枺?/td> | 202110451394.2 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113268985B | 公開(公告)日: | 2023-06-20 |
| 發(fā)明(設(shè)計)人: | 蔡毅;劉諍 | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06N5/04;G06N3/0464 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 黎揚(yáng)鵬 |
| 地址: | 510641 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 關(guān)系 路徑 遠(yuǎn)程 監(jiān)督 抽取 方法 裝置 介質(zhì) | ||
1.一種基于關(guān)系路徑的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于,包括以下步驟:
通過遠(yuǎn)程監(jiān)督機(jī)制將知識庫中的實體對和文本語料中的實體對進(jìn)行對齊,構(gòu)建實體對句子集合,根據(jù)實體對的內(nèi)容將句子劃分為多個包;
針對每個包的句子,通過直接句子編碼模塊獲取實體對的相應(yīng)關(guān)系的預(yù)測概率;
針對每個包對應(yīng)的實體對的推理關(guān)系路徑,通過關(guān)系路徑編碼模塊獲取關(guān)系路徑推理出相應(yīng)關(guān)系的預(yù)測概率;
在聯(lián)合學(xué)習(xí)模塊中,結(jié)合直接句子編碼模塊中的信息和關(guān)系路徑編碼模塊中的信息獲取最終對應(yīng)實體對的預(yù)測關(guān)系;
所述通過關(guān)系路徑編碼模塊獲取關(guān)系路徑推理出相應(yīng)關(guān)系的預(yù)測概率,包括:給定一個實體對(h,t)之間存在的關(guān)系路徑p,該關(guān)系路徑p連接了n個實體對{(h,e1),(e1,e2),…,(en-1,t)},設(shè)這n個實體對對應(yīng)的關(guān)系集合為Rp={r1,r2,…,rn};每一個被連接的實體對都至少代表了一個句子,基于關(guān)系路徑p推理出關(guān)系r的條件概率描述為:
其中,uq衡量了根據(jù)該關(guān)系路徑p推理出關(guān)系r的置信度;uq的表達(dá)式為:
其中,rt是對于實體對(h,t)的已被遠(yuǎn)程監(jiān)督機(jī)制標(biāo)注好的關(guān)系;
所述聯(lián)合學(xué)習(xí)模塊損失函數(shù)和貢獻(xiàn)函數(shù)的表達(dá)式如下:
L(h,r,t)=F(h,r,t|S)+αK(h,r,t|P)
其中,T是文本中所有訓(xùn)練集關(guān)系三元組的集合,θ代表整個模型參數(shù)的集合,F(xiàn)(h,r,t|S)代表從直接句子編碼模塊得到的關(guān)系r和實體對(h,t)的關(guān)聯(lián)信息,而K(h,r,t|P)代表了從關(guān)系路徑編碼模塊中獲得的推理信息,α是用于平衡兩種來源信息的參數(shù)。
2.根據(jù)權(quán)利要求1所述的一種基于關(guān)系路徑的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于,所述構(gòu)建實體對句子集合,包括:
根據(jù)遠(yuǎn)程監(jiān)督機(jī)制構(gòu)造出的實體對句子集合,整理每個實體對對應(yīng)的兩跳或多跳的關(guān)系路徑;
將每個包對應(yīng)的關(guān)系路徑信息通過路徑表示框架進(jìn)行建模,得到每個預(yù)定義關(guān)系的預(yù)測置信度。
3.根據(jù)權(quán)利要求1所述的一種基于關(guān)系路徑的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于,所述直接句子編碼模塊包括輸入表示層、句子表示編碼層和包表示編碼層;
輸入表示層用于獲取句子中每個詞的向量表示,進(jìn)而得到整個句子的向量表示序列;
句子表示編碼層用于將句子的向量表示轉(zhuǎn)化成整個句子的特征表示向量;
包表示編碼層采用基于自注意力機(jī)制的多示例學(xué)習(xí)方法,對包中所有句子的特征表示向量進(jìn)行加權(quán)求和,得到整個包的表示向量。
4.根據(jù)權(quán)利要求3所述的一種基于關(guān)系路徑的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于,所述獲取句子中每個詞的向量表示,進(jìn)而得到整個句子的向量表示序列,包括:
利用詞嵌入技術(shù)拼接每個詞的語義信息向量和位置信息向量,以建模出每個詞的向量表示xi∈Rk,k=kw+kp×2;
其中,kw代表該詞語義信息向量的維度,kp×2代表該詞的相對位置信息向量。
5.根據(jù)權(quán)利要求3所述的一種基于關(guān)系路徑的遠(yuǎn)程監(jiān)督關(guān)系抽取方法,其特征在于,所述對包中所有句子的特征表示向量進(jìn)行加權(quán)求和,包括:
將句子級別注意力機(jī)制權(quán)重加入到包中的句子中,以使有效的句子比重增大,帶有噪音的句子比重減小;
獲得降噪后的包的特征表示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110451394.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 路徑搜索系統(tǒng)、路徑搜索終端和路徑搜索方法
- 路徑計算方法、路徑計算單元及路徑計算系統(tǒng)
- 路徑顯示裝置、路徑顯示方法、路徑顯示程序及路徑顯示系統(tǒng)
- 路徑引導(dǎo)裝置、路徑引導(dǎo)方法及路徑引導(dǎo)程序
- 路徑搜索系統(tǒng)、路徑搜索方法及路徑搜索程序
- 路徑引導(dǎo)裝置、路徑引導(dǎo)方法以及路徑引導(dǎo)程序
- 路徑搜索系統(tǒng)、路徑搜索方法以及路徑搜索程序
- 路徑搜索裝置、路徑搜索系統(tǒng)及路徑搜索方法
- 路徑輸出方法、路徑輸出系統(tǒng)和路徑輸出程序
- 路徑評價裝置、路徑評價系統(tǒng)、路徑評價方法以及路徑評價程序
- 用于提供遠(yuǎn)程幫助的方法和服務(wù)器
- 遠(yuǎn)程登錄會話維護(hù)方法、遠(yuǎn)程登錄代理和計算機(jī)網(wǎng)絡(luò)系統(tǒng)
- 汽車遠(yuǎn)程控制裝置和方法
- 一種基于EMS系統(tǒng)的變電站遠(yuǎn)程監(jiān)控系統(tǒng)
- 遠(yuǎn)程控制終端、遠(yuǎn)程控制方法、遠(yuǎn)程受控終端和遠(yuǎn)程受控方法
- 對遠(yuǎn)程受控終端的受控方式進(jìn)行自定義的裝置及方法
- 一種基于互聯(lián)網(wǎng)的移動遠(yuǎn)程醫(yī)療綜合服務(wù)系統(tǒng)
- 一種遠(yuǎn)程控制方法、裝置及存儲介質(zhì)
- 一種遠(yuǎn)程炒菜機(jī)、遠(yuǎn)程炒菜機(jī)系統(tǒng)及遠(yuǎn)程炒菜方法
- 一種計算機(jī)遠(yuǎn)程控制組件





