[發(fā)明專利]非結(jié)構(gòu)化文本的事件抽取方法、系統(tǒng)及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202110363162.1 | 申請(qǐng)日: | 2021-04-02 |
| 公開(kāi)(公告)號(hào): | CN113010593A | 公開(kāi)(公告)日: | 2021-06-22 |
| 發(fā)明(設(shè)計(jì))人: | 劉鋒;張學(xué)龍;王嘵鳴;劉弦弦 | 申請(qǐng)(專利權(quán))人: | 北京智通云聯(lián)科技有限公司 |
| 主分類號(hào): | G06F16/25 | 分類號(hào): | G06F16/25;G06F16/31;G06F40/211;G06F40/242;G06F40/295;G06N3/08 |
| 代理公司: | 北京八月瓜知識(shí)產(chǎn)權(quán)代理有限公司 11543 | 代理人: | 秦瑩 |
| 地址: | 100020 北京市朝陽(yáng)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)構(gòu) 文本 事件 抽取 方法 系統(tǒng) 裝置 | ||
本發(fā)明公開(kāi)了一種非結(jié)構(gòu)化文本的事件抽取方法、系統(tǒng)及裝置,所述方法包括:基于預(yù)先構(gòu)建好的事件意圖字典庫(kù)對(duì)非結(jié)構(gòu)化文本中的事件進(jìn)行抽取,識(shí)別事件的事件類型,并基于預(yù)先構(gòu)建好的事件角色字典庫(kù),對(duì)事件中的角色要素進(jìn)行識(shí)別;根據(jù)事件類型和角色要素,對(duì)事件進(jìn)行結(jié)構(gòu)化存儲(chǔ)。本發(fā)明通過(guò)配置字典的形式,使得問(wèn)句中事件的解析更靈活,便于維護(hù),易于擴(kuò)展,避免了深度學(xué)習(xí)需要收集相關(guān)語(yǔ)料、標(biāo)注、訓(xùn)練等復(fù)雜的工序。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能自然語(yǔ)言處理技術(shù)領(lǐng)域,尤其是涉及一種非結(jié)構(gòu)化文本的事件抽取方法、系統(tǒng)及裝置。
背景技術(shù)
在現(xiàn)有技術(shù)中,事件抽取是把含有事件信息的非結(jié)構(gòu)化文本以結(jié)構(gòu)化的形式呈現(xiàn)出來(lái),在自動(dòng)文摘、自動(dòng)問(wèn)答、信息檢索等領(lǐng)域有著廣泛的應(yīng)用。事件抽取技術(shù)的核心價(jià)值,是可以把半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)事件的結(jié)構(gòu)化描述,進(jìn)而支持豐富的下游應(yīng)用。
目前的實(shí)體識(shí)別主要采取機(jī)器學(xué)習(xí)、深度學(xué)習(xí),但是都存在不足之處:
(1)基于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)的方法,首先需要收集前期的訓(xùn)練語(yǔ)料,然后進(jìn)行標(biāo)注,然而,對(duì)于金融、保險(xiǎn)、石化等垂直領(lǐng)域,所需的標(biāo)注語(yǔ)料是非常稀缺的,從而增加了該技術(shù)方案落地的困難性;同時(shí),深度學(xué)習(xí)的效果存在很大的不穩(wěn)定因素,準(zhǔn)確率難以把控;
(2)基于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)的方法,對(duì)于事件類型的增加則比較繁瑣,需要從新訓(xùn)練,效率低下。
因此目前亟需一種新的非結(jié)構(gòu)化文本事件抽取方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種非結(jié)構(gòu)化文本的事件抽取方法、系統(tǒng)及裝置,旨在解決現(xiàn)有技術(shù)中的上述問(wèn)題。
本發(fā)明提供一種非結(jié)構(gòu)化文本的事件抽取方法,包括:
基于預(yù)先構(gòu)建好的事件意圖字典庫(kù)對(duì)非結(jié)構(gòu)化文本中的事件進(jìn)行抽取,識(shí)別事件的事件類型,并基于預(yù)先構(gòu)建好的事件角色字典庫(kù),對(duì)事件中的角色要素進(jìn)行識(shí)別;
根據(jù)事件類型和角色要素,對(duì)事件進(jìn)行結(jié)構(gòu)化存儲(chǔ)。
本發(fā)明提供一種非結(jié)構(gòu)化文本的事件抽取系統(tǒng),包括:
解析層,用于基于預(yù)先構(gòu)建好的事件意圖字典庫(kù)對(duì)非結(jié)構(gòu)化文本中的事件進(jìn)行抽取,識(shí)別事件的事件類型,并基于預(yù)先構(gòu)建好的事件角色字典庫(kù),對(duì)事件中的角色要素進(jìn)行識(shí)別;
應(yīng)用層,用于根據(jù)事件類型和角色要素,對(duì)事件進(jìn)行結(jié)構(gòu)化存儲(chǔ)。
本發(fā)明實(shí)施例還提供一種非結(jié)構(gòu)化文本的事件抽取裝置,包括:存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述非結(jié)構(gòu)化文本的事件抽取方法的步驟。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有信息傳遞的實(shí)現(xiàn)程序,程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述非結(jié)構(gòu)化文本的事件抽取方法的步驟。
采用本發(fā)明實(shí)施例,在特定領(lǐng)域中性能較好,知識(shí)表示簡(jiǎn)潔,便于理解和后續(xù)應(yīng)用;本發(fā)明實(shí)施例通過(guò)配置字典的形式,使得問(wèn)句中事件的解析更靈活,便于維護(hù),易于擴(kuò)展,避免了深度學(xué)習(xí)需要收集相關(guān)語(yǔ)料、標(biāo)注、訓(xùn)練等復(fù)雜的工序。此外,本發(fā)明實(shí)施例基于規(guī)則的方式,在領(lǐng)域內(nèi)能夠?qū)崿F(xiàn)較高的事件識(shí)別準(zhǔn)確率,避免了基于深度學(xué)習(xí)的不穩(wěn)定性。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施方式,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京智通云聯(lián)科技有限公司,未經(jīng)北京智通云聯(lián)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110363162.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測(cè)裝置和攻擊檢測(cè)方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種樹狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲(chǔ)介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





