[發(fā)明專利]事件名的生成方法、裝置、設(shè)備及介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202011383857.8 | 申請(qǐng)日: | 2020-11-30 |
| 公開(kāi)(公告)號(hào): | CN112507697B | 公開(kāi)(公告)日: | 2023-09-22 |
| 發(fā)明(設(shè)計(jì))人: | 潘祿;陳玉光 | 申請(qǐng)(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G06F40/258 | 分類號(hào): | G06F40/258;G06F40/30;G06N3/0442;G06N3/08 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 韓海花 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 事件 生成 方法 裝置 設(shè)備 介質(zhì) | ||
本申請(qǐng)公開(kāi)了一種事件名的生成方法、裝置、設(shè)備及介質(zhì),涉及自然語(yǔ)言處理和知識(shí)圖譜技術(shù)領(lǐng)域。具體實(shí)現(xiàn)方案為:獲取目標(biāo)事件的結(jié)構(gòu)化信息,從目標(biāo)事件的結(jié)構(gòu)化信息中提取論元信息,并根據(jù)論元信息生成論元語(yǔ)義表示向量,根據(jù)論元語(yǔ)義表示向量生成目標(biāo)事件的事件語(yǔ)義表示向量,獲取目標(biāo)事件的事件相關(guān)文本,并根據(jù)事件相關(guān)文本生成文本語(yǔ)義表示向量;以及根據(jù)事件語(yǔ)義表示向量和文本語(yǔ)義表示向量生成事件名。由此,通過(guò)引入結(jié)構(gòu)化信息,從該結(jié)構(gòu)化信息中提取出論元相關(guān)信息,進(jìn)而基于該論元相關(guān)信息和事件相關(guān)文本進(jìn)行事件名生成,由于論元相關(guān)信息有利于生成事件名中的主語(yǔ)和賓語(yǔ)部分,從而提高了事件名生成的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請(qǐng)公開(kāi)了一種事件名的生成方法、裝置、設(shè)備及介質(zhì),涉及深度學(xué)習(xí)技術(shù)領(lǐng)域,具體涉及自然語(yǔ)言處理和知識(shí)圖譜技術(shù)領(lǐng)域。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展,新聞事件得到越來(lái)越多的關(guān)注,在新聞推送網(wǎng)站中,通常需要根據(jù)新聞對(duì)應(yīng)的事件實(shí)體生成事件名。
相關(guān)技術(shù)中,從給定的事件相關(guān)文本中生成事件名時(shí),可以采用基于抽取式的事件名生成方法,首先從文本中選擇重要的句子,然后抽取出主謂賓組成事件名。但是,該事件名生成方法依賴于人工構(gòu)建的規(guī)則和模板,存在人工構(gòu)建成本高,不具備泛化能力等缺點(diǎn)。
發(fā)明內(nèi)容
本申請(qǐng)?zhí)峁┝艘环N事件名的生成方法、裝置、設(shè)備及介質(zhì)。
本申請(qǐng)的一方面,提供了一種事件名的生成方法,包括:
獲取目標(biāo)事件的結(jié)構(gòu)化信息;
從所述目標(biāo)事件的結(jié)構(gòu)化信息中提取論元信息,并根據(jù)所述論元信息生成論元語(yǔ)義表示向量;
根據(jù)所述論元語(yǔ)義表示向量生成所述目標(biāo)事件的事件語(yǔ)義表示向量;
獲取所述目標(biāo)事件的事件相關(guān)文本,并根據(jù)所述事件相關(guān)文本生成文本語(yǔ)義表示向量;以及
根據(jù)所述事件語(yǔ)義表示向量和所述文本語(yǔ)義表示向量生成事件名。
作為本申請(qǐng)一方面的一種可能的實(shí)現(xiàn)方式,所述從所述目標(biāo)事件的結(jié)構(gòu)化信息中提取論元信息,并根據(jù)所述論元信息生成論元語(yǔ)義表示向量,包括:
從所述結(jié)構(gòu)化信息中提取至少一組所述論元信息;其中,各組所述論元信息中包含論元角色和論元值;
將屬于同一組所述論元信息的所述論元角色和所述論元值輸入第一雙向長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM模型以生成所述論元角色向量和論元值向量;
將所述論元角色向量和所述論元向量拼接以生成所述論元語(yǔ)義表示向量。
作為本申請(qǐng)一方面的另一種可能的實(shí)現(xiàn)方式,所述論元信息為多組,每一組所述論元信息具有對(duì)應(yīng)的所述論元語(yǔ)義表示向量,所述根據(jù)所述論元語(yǔ)義表示向量生成所述目標(biāo)事件的事件語(yǔ)義表示向量,包括:
將各組所述論元信息所對(duì)應(yīng)的論元語(yǔ)義表示向量輸入至第二雙向LSTM模型以生成所述事件語(yǔ)義表示向量。
作為本申請(qǐng)一方面的另一種可能的實(shí)現(xiàn)方式,所述根據(jù)所述事件相關(guān)文本生成文本語(yǔ)義表示向量,包括:
對(duì)所述事件相關(guān)文本進(jìn)行分詞以生成多個(gè)詞,并獲取所述多個(gè)詞的多個(gè)詞編碼向量;
將所述多個(gè)詞編碼向量輸入至第三雙向LSTM模型以生成所述文本語(yǔ)義表示向量。
作為本申請(qǐng)一方面的另一種可能的實(shí)現(xiàn)方式,所述根據(jù)所述事件語(yǔ)義表示向量和所述文本語(yǔ)義表示向量生成事件名,包括:
將所述事件語(yǔ)義表示向量和所述文本語(yǔ)義表示向量拼接,得到拼接向量;
將所述拼接向量輸入解碼器,以得到所述解碼器輸出的所述事件名。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011383857.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測(cè)裝置和攻擊檢測(cè)方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種樹(shù)狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲(chǔ)介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





