[發(fā)明專利]基于新型關(guān)系注意力機(jī)制的實(shí)體關(guān)系抽取方法及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202010774426.8 | 申請(qǐng)日: | 2020-08-04 |
| 公開(kāi)(公告)號(hào): | CN112084778A | 公開(kāi)(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計(jì))人: | 尹帆;毛養(yǎng)勤;覃俊;李子茂;毛騰躍;劉晶;廖立婷 | 申請(qǐng)(專利權(quán))人: | 中南民族大學(xué) |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06F40/30;G06N3/04 |
| 代理公司: | 武漢知產(chǎn)時(shí)代知識(shí)產(chǎn)權(quán)代理有限公司 42238 | 代理人: | 孔燦 |
| 地址: | 430074 湖北*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 新型 關(guān)系 注意力 機(jī)制 實(shí)體 抽取 方法 設(shè)備 | ||
1.基于新型關(guān)系注意力機(jī)制的實(shí)體關(guān)系抽取方法,其特征在于:
S101:獲取有標(biāo)簽數(shù)據(jù);所述有標(biāo)簽數(shù)據(jù)具體為有標(biāo)簽的句子包;
S102:采用PCNN模型提取所述有標(biāo)簽的句子包中每個(gè)句子的語(yǔ)義向量;所述PCNN模型包括輸入層、卷積層和池化層;
S103:根據(jù)所述有標(biāo)簽的句子包中每個(gè)句子的語(yǔ)義向量,采用NATT注意力機(jī)制,提取所述有標(biāo)簽的句子包的特征向量;
S104:將所述有標(biāo)簽的句子包的特征向量輸入至sofmax分類器,得到所述有標(biāo)簽句子包中每個(gè)句子的語(yǔ)義向量和關(guān)系向量之間關(guān)系的置信度;所述關(guān)系向量具體為根據(jù)所述有標(biāo)簽的句子包的原始向量隨機(jī)生成的初始化向量。
2.如權(quán)利要求1所述的一種基于新型關(guān)系注意力機(jī)制的實(shí)體關(guān)系抽取方法,其特征在于:步驟S101中,獲取有標(biāo)簽數(shù)據(jù),具體方式為:采用遠(yuǎn)程監(jiān)督方法通過(guò)自動(dòng)對(duì)齊遠(yuǎn)程知識(shí)庫(kù)獲取有標(biāo)簽數(shù)據(jù)集。
3.如權(quán)利要求1所述的一種一種基于新型關(guān)系注意力機(jī)制的實(shí)體關(guān)系抽取方法,其特征在于:步驟S102中,采用PCNN模型提取所述有標(biāo)簽的句子包中每個(gè)句子的語(yǔ)義向量,具體步驟為:
S201:所述有標(biāo)簽的句子包中任意一個(gè)句子s包括n個(gè)單詞,即s=(w1,w2,...,wn)其中,wi為句子s中的第i個(gè)單詞;句子s通過(guò)映射詞向量表,其單詞wi被轉(zhuǎn)換成詞向量ei,即s=(w1,w2,...,wn)通過(guò)映射詞向量表,被轉(zhuǎn)換成s=(e1,e2,...,en);
S202:對(duì)句子s中的單詞wi,計(jì)算其分別相對(duì)于句子s中頭實(shí)體和尾實(shí)體的相對(duì)距離,然后將這兩個(gè)相對(duì)距離映射成為單詞wi位置向量di;
S203:?jiǎn)卧~wi的詞向量和位置向量拼接得到單詞wi的特征向量:;將句子s中每個(gè)單詞的特征向量作為PCNN模型輸入層的輸入;
S204:利用PCNN模型的卷積層對(duì)句子s中每個(gè)單詞的特征向量進(jìn)行卷積操作,得到每個(gè)單詞的結(jié)果向量c,具體如式(1):
式(1)中,ci為第i個(gè)單詞經(jīng)過(guò)卷積操作后的結(jié)果向量;Wi為第i個(gè)權(quán)重矩陣,b為預(yù)設(shè)的偏置值;
S205:將每個(gè)單詞的結(jié)果向量c分割為三部分,具體為ci={ci,1,ci,2,ci,3},利用PCNN模型的池化層分別對(duì)每部分進(jìn)行最大池化,得到最大池化向量pi={pi,1,pi,2,pi,3};其中pi,j=max(ci,j),j=1,2,3;
S206:根據(jù)最大池化向量得到句子s的語(yǔ)義向量S=tanh(p),其中p=(p1,p2,...,pn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南民族大學(xué),未經(jīng)中南民族大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010774426.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 關(guān)系視圖
- 位置關(guān)系檢測(cè)裝置以及位置關(guān)系檢測(cè)系統(tǒng)
- 關(guān)系建模
- 關(guān)系分析方法、關(guān)系分析程序、以及關(guān)系分析裝置
- 實(shí)體關(guān)系分類裝置和實(shí)體關(guān)系分類方法
- 用戶關(guān)系抽取方法和用戶關(guān)系抽取系統(tǒng)
- 融合依存關(guān)系與篇章修辭關(guān)系的事件時(shí)序關(guān)系識(shí)別方法
- 開(kāi)關(guān)系統(tǒng)
- 視頻視覺(jué)關(guān)系檢測(cè)的關(guān)系片段連接方法
- 開(kāi)關(guān)系統(tǒng)
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置





