[發(fā)明專利]實(shí)體關(guān)系抽取方法、裝置、電子設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202011275193.3 | 申請日: | 2020-11-13 |
| 公開(公告)號: | CN112232074B | 公開(公告)日: | 2022-01-04 |
| 發(fā)明(設(shè)計(jì))人: | 任夢星;劉炎;覃建策;陳邦忠 | 申請(專利權(quán))人: | 完美世界控股集團(tuán)有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/211;G06F16/33 |
| 代理公司: | 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 11662 | 代理人: | 曾軍;田俊峰 |
| 地址: | 100089 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 實(shí)體 關(guān)系 抽取 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種實(shí)體關(guān)系抽取方法,其特征在于,所述方法包括:
對待抽取的目標(biāo)文本進(jìn)行分詞處理,得到多個(gè)詞語;
對每一所述詞語進(jìn)行詞性標(biāo)注,得到每一所述詞語的詞性標(biāo)記;
基于每一所述詞語的詞性標(biāo)記對所述目標(biāo)文本進(jìn)行依存句法分析,得到所述目標(biāo)文本的依存句法樹;所述依存句法樹用于描述每一所述詞語的依存結(jié)構(gòu),所述依存結(jié)構(gòu)包括:所述詞語的詞性標(biāo)記、所述詞語的父節(jié)點(diǎn)和所述父節(jié)點(diǎn)的詞性標(biāo)記、所述詞語和其父節(jié)點(diǎn)之間的依存關(guān)系標(biāo)簽;
基于所述依存句法樹確定所述目標(biāo)文本所符合的句法模式,以及基于所述句法模式從所述目標(biāo)文本抽取實(shí)體關(guān)系三元組;基于預(yù)設(shè)的實(shí)體校正規(guī)則對所述實(shí)體關(guān)系三元組中的實(shí)體進(jìn)行校正;
其中,所述基于依存句法樹確定所述目標(biāo)文本所符合的句法模式,包括:按照多個(gè)所述詞語在所述目標(biāo)文本中的排列順序,依次將每一所述詞語的詞性標(biāo)記和所述詞語與其父節(jié)點(diǎn)之間的依存關(guān)系標(biāo)簽組合,得到初始句法模式;從預(yù)設(shè)的句法模式集中確定與所述初始句法模式相匹配的目標(biāo)句法模式,其中所述預(yù)設(shè)的句法模式集中包含多個(gè)句法模式,每一句法模式由至少一個(gè)依存關(guān)系標(biāo)簽來表示;將所述目標(biāo)句法模式確定為所述目標(biāo)文本所符合的句法模式;
所述基于預(yù)設(shè)的實(shí)體校正規(guī)則對所述實(shí)體關(guān)系三元組中的實(shí)體進(jìn)行校正,包括:以所述實(shí)體關(guān)系三元組中的首個(gè)實(shí)體為關(guān)鍵字查找預(yù)設(shè)的代詞詞表;如果在所述代詞詞表中查找到所述關(guān)鍵字,則將所述實(shí)體關(guān)系三元組中的首個(gè)實(shí)體更新為第二實(shí)體關(guān)系三元組中的首個(gè)實(shí)體;所述第二實(shí)體關(guān)系三元組是指基于第二句法模式從所述目標(biāo)文本中抽取的實(shí)體關(guān)系三元組。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于句法模式從所述目標(biāo)文本抽取實(shí)體關(guān)系三元組,包括:
基于所述句法模式中的各依存關(guān)系標(biāo)簽從所述目標(biāo)文本中抽取目標(biāo)詞元和核心關(guān)系詞;
將抽取出的所述目標(biāo)詞元和核心關(guān)系詞組成實(shí)體關(guān)系三元組。
3.根據(jù)權(quán)利要求1~2任一所述的方法,其特征在于,在所述基于句法模式從所述目標(biāo)文本抽取實(shí)體關(guān)系三元組之后,還包括:
基于所述依存句法樹確定是否對所述實(shí)體關(guān)系三元組中的關(guān)系詞進(jìn)行修正。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于依存句法樹確定是否對所述實(shí)體關(guān)系三元組中的關(guān)系詞進(jìn)行修正,包括:
檢查所述依存句法樹中是否存在與所述實(shí)體關(guān)系三元組中的關(guān)系詞相連且滿足設(shè)定條件的目標(biāo)詞語;所述設(shè)定條件為:詞性標(biāo)記為副詞,依存標(biāo)簽為指定依存標(biāo)簽,以及包含在預(yù)設(shè)的關(guān)鍵標(biāo)志詞詞表中;
如果是,則確定對所述實(shí)體關(guān)系三元組中的關(guān)系詞進(jìn)行修正。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對所述實(shí)體關(guān)系三元組中的關(guān)系詞進(jìn)行修正,包括:
將所述實(shí)體關(guān)系三元組中的關(guān)系詞更新為所述目標(biāo)詞語與所述關(guān)系詞的組合;或者,
將所述實(shí)體關(guān)系三元組中的關(guān)系詞更新為所述目標(biāo)詞語、所述關(guān)系詞,以及所述目標(biāo)文本中位于所述目標(biāo)詞語和所述關(guān)系詞之間的名詞性短語的組合。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述指定依存標(biāo)簽為:ADV或CMP,所述關(guān)鍵標(biāo)志詞詞表中包含至少一個(gè)否定詞;或者,
所述指定依存標(biāo)簽為ADV,所述關(guān)鍵標(biāo)志詞詞表中包含至少一個(gè)被動標(biāo)志詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于完美世界控股集團(tuán)有限公司,未經(jīng)完美世界控股集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011275193.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種實(shí)體關(guān)系識別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲介質(zhì)
- 基于實(shí)體對齊的屬性融合方法、裝置、設(shè)備及存儲介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲介質(zhì)





