[發(fā)明專(zhuān)利]一種中文事件觸發(fā)詞抽取方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110647875.0 | 申請(qǐng)日: | 2021-06-10 |
| 公開(kāi)(公告)號(hào): | CN113468884B | 公開(kāi)(公告)日: | 2023-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 楊昊;趙剛;王興芬 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京信息科技大學(xué) |
| 主分類(lèi)號(hào): | G06F40/289 | 分類(lèi)號(hào): | G06F40/289;G06F40/211;G06F40/30;G06F40/216;G06N3/045;G06N3/0442 |
| 代理公司: | 北京天方智力知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11719 | 代理人: | 路遠(yuǎn) |
| 地址: | 100192 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 中文 事件 觸發(fā) 抽取 方法 裝置 | ||
1.一種中文事件觸發(fā)詞抽取方法,其特征在于,包括以下步驟:
對(duì)輸入文本進(jìn)行全分詞、依存句法分析,提取依存句法分析中未出現(xiàn)的單詞的所有義原;
對(duì)提取的字符、單詞、義原進(jìn)行初始向量化,利用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)BiLSTM對(duì)每個(gè)句子中的字符進(jìn)行訓(xùn)練,得到每個(gè)字符能夠記憶其句中前后字符特征的向量表征;
將BiLSTM的輸出輸入到節(jié)點(diǎn)注意力網(wǎng)絡(luò),有側(cè)重地捕捉與當(dāng)前節(jié)點(diǎn)同一類(lèi)型鄰居節(jié)點(diǎn)的特征,將節(jié)點(diǎn)注意力網(wǎng)絡(luò)的輸出輸入到類(lèi)型注意力網(wǎng)絡(luò),有側(cè)重地捕捉與當(dāng)前節(jié)點(diǎn)不同類(lèi)型鄰居節(jié)點(diǎn)的特征;節(jié)點(diǎn)類(lèi)型包括字符節(jié)點(diǎn)、單詞節(jié)點(diǎn)和義原節(jié)點(diǎn);
將類(lèi)型注意力網(wǎng)絡(luò)的輸出輸入到一個(gè)條件隨機(jī)場(chǎng),輸出標(biāo)注序列,實(shí)現(xiàn)觸發(fā)詞的抽取;
節(jié)點(diǎn)注意力網(wǎng)絡(luò)的輸出為:
eij=LeakyReLU(vτ[Wτhi,Wτhj])
式中,為節(jié)點(diǎn)注意力網(wǎng)絡(luò)第i個(gè)節(jié)點(diǎn)的輸出向量,σ、LeakyReLU為激勵(lì)函數(shù),Nτ,i表示與第i個(gè)節(jié)點(diǎn)即當(dāng)前節(jié)點(diǎn)相鄰的τ類(lèi)型節(jié)點(diǎn)的集合,Wτ為τ類(lèi)型節(jié)點(diǎn)的維度變換矩陣,aij為第j個(gè)節(jié)點(diǎn)輸入向量hj的權(quán)重,eij為第i個(gè)節(jié)點(diǎn)與第j個(gè)節(jié)點(diǎn)的相似度,vτ為τ類(lèi)型節(jié)點(diǎn)的權(quán)重矩陣,hi為第i個(gè)節(jié)點(diǎn)輸入向量;
對(duì)包括節(jié)點(diǎn)注意力網(wǎng)絡(luò)和類(lèi)型注意力網(wǎng)絡(luò)的異構(gòu)圖注意力網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),基于maskattention機(jī)制依次實(shí)現(xiàn)以下4個(gè)步驟的網(wǎng)絡(luò)特征傳播:
VC→VW:
VW→VS:
VS→VW:
VW→VC:
其中,Vc、Vw、Vs分別為字符節(jié)點(diǎn),單詞節(jié)點(diǎn)和義原節(jié)點(diǎn);HGAT表示異構(gòu)圖注意力網(wǎng)絡(luò),GAT表示節(jié)點(diǎn)注意力網(wǎng)絡(luò),Hc、Hw、Hs分別為字符節(jié)點(diǎn)、單詞節(jié)點(diǎn)和義原節(jié)點(diǎn)的矩陣表示,其上標(biāo)為更新次數(shù),初始矩陣為
網(wǎng)絡(luò)特征傳播采用端到端的訓(xùn)練方法,每一步傳播過(guò)程采用殘差連接方式解決梯度消失問(wèn)題,即其中,h′、hi分別為當(dāng)前傳播步驟的輸出和輸入,為下一傳播步驟的輸入。
2.根據(jù)權(quán)利要求1所述的中文事件觸發(fā)詞抽取方法,其特征在于,類(lèi)型注意力網(wǎng)絡(luò)的輸出為:
式中,hi′為類(lèi)型注意力網(wǎng)絡(luò)第i個(gè)節(jié)點(diǎn)的輸出向量,βi,τ為的權(quán)重,mi,τ為τ類(lèi)型節(jié)點(diǎn)對(duì)輸出向量的貢獻(xiàn)程度,Ci為第i個(gè)節(jié)點(diǎn)鄰居節(jié)點(diǎn)類(lèi)型的集合,|Ci|為Ci的元素個(gè)數(shù),q為注意力向量,tanh為激勵(lì)函數(shù),W、b分別為權(quán)重和偏置矩陣。
3.根據(jù)權(quán)利要求1所述的中文事件觸發(fā)詞抽取方法,其特征在于,條件隨機(jī)場(chǎng)的損失函數(shù)為:
Loss=-log10(p(Y|X))
式中,Loss為損失函數(shù),X={x1,x2...,xn}、Y={y1,y2…,yn}分別為輸入和輸出序列,p(Y|X)為X序列被標(biāo)記為Y序列的概率,S(X,Y)為得分函數(shù),為標(biāo)注集合,Y′為任意一個(gè)標(biāo)注,為初始轉(zhuǎn)移得分,為結(jié)尾轉(zhuǎn)移得分,為由yi-1轉(zhuǎn)移到y(tǒng)i的得分,為xi標(biāo)記為yi的得分,Ws、bs分別為權(quán)重和偏置矩陣。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京信息科技大學(xué),未經(jīng)北京信息科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110647875.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測(cè)裝置和攻擊檢測(cè)方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種樹(shù)狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲(chǔ)介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





