[發(fā)明專利]元事件抽取方法、裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110282621.3 | 申請日: | 2021-03-16 |
| 公開(公告)號: | CN112906391A | 公開(公告)日: | 2021-06-04 |
| 發(fā)明(設(shè)計)人: | 王玉杰;吳飛;刁永祥;方四安;張浩宇;代旭東;柳林;徐承 | 申請(專利權(quán))人: | 合肥訊飛數(shù)碼科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 230088 安徽省合肥市高新區(qū)*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 事件 抽取 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明提供一種元事件抽取方法、裝置、電子設(shè)備和存儲介質(zhì),其中方法包括:確定待處理文本包含的觸發(fā)詞及其對應的各參數(shù)詞;抽取觸發(fā)詞對應的每兩個參數(shù)詞在待處理文本中的關(guān)系;基于觸發(fā)詞對應的各參數(shù)詞,以及每兩個參數(shù)詞之間的關(guān)系類型,構(gòu)建觸發(fā)詞的參數(shù)關(guān)系圖;遍歷觸發(fā)詞的參數(shù)關(guān)系圖,得到觸發(fā)詞的各元事件。本發(fā)明提供的方法、裝置、電子設(shè)備和存儲介質(zhì),完成了同一觸發(fā)詞下多元事件的事件拆分,從而實現(xiàn)細粒度的元事件抽取,有助于提高元事件抽取的可靠性和準確性。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種元事件抽取方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
在信息抽取(Information Extraction:IE)領(lǐng)域,事件抽取技術(shù)是從非結(jié)構(gòu)化的信息中抽取出用戶感興趣的事件,并以結(jié)構(gòu)化的形式呈現(xiàn)給用戶。事件抽取主要面向于元事件(Meta Event),元事件表示一個動作的發(fā)生或者狀態(tài)的變化。
近年來,事件抽取在金融、輿情等領(lǐng)域得到了廣泛的應用。但是在短文本場景下,例如新聞摘要、微博短文本等,通常在較短的文本中包含了豐富的內(nèi)容信息,可能一個觸發(fā)詞對應了多個元事件,此時傳統(tǒng)的事件抽取方式僅能夠抽取一個事件類的參數(shù),并無法實現(xiàn)單個事件的抽取。
發(fā)明內(nèi)容
本發(fā)明提供一種元事件抽取方法、裝置、電子設(shè)備和存儲介質(zhì),用以解決現(xiàn)有技術(shù)中短文本場景下無法實現(xiàn)單個事件抽取的缺陷。
本發(fā)明提供一種元事件抽取方法,包括:
確定待處理文本包含的觸發(fā)詞及其對應的各參數(shù)詞;
抽取所述觸發(fā)詞對應的每兩個參數(shù)詞在所述待處理文本中的關(guān)系;
基于所述觸發(fā)詞對應的各參數(shù)詞,以及每兩個參數(shù)詞之間的關(guān)系類型,構(gòu)建所述觸發(fā)詞的參數(shù)關(guān)系圖;
遍歷所述觸發(fā)詞的參數(shù)關(guān)系圖,得到所述觸發(fā)詞的各元事件。
根據(jù)本發(fā)明提供的一種元事件抽取方法,所述基于所述觸發(fā)詞對應的各參數(shù)詞,以及每兩個參數(shù)詞之間的關(guān)系類型,構(gòu)建所述觸發(fā)詞的參數(shù)關(guān)系圖,包括:
以所述觸發(fā)詞對應的各參數(shù)詞為節(jié)點,連接所述關(guān)系類型為存在關(guān)系的每兩個參數(shù)詞對應節(jié)點,得到所述參數(shù)關(guān)系圖。
根據(jù)本發(fā)明提供的一種元事件抽取方法,所述遍歷所述觸發(fā)詞的參數(shù)關(guān)系圖,得到所述觸發(fā)詞的各元事件,包括:
基于所述參數(shù)關(guān)系圖中各節(jié)點之間的連接關(guān)系,從所述參數(shù)關(guān)系圖中抽取各節(jié)點集合,基于各節(jié)點集合確定各元事件;
所述節(jié)點集合內(nèi)包含多個兩兩相連的節(jié)點。
根據(jù)本發(fā)明提供的一種元事件抽取方法,所述基于所述參數(shù)關(guān)系圖中各節(jié)點之間的連接關(guān)系,從所述參數(shù)關(guān)系圖中抽取各節(jié)點集合,包括:
從所述參數(shù)關(guān)系圖中隨機選擇剪枝起始節(jié)點,若所述剪枝起始節(jié)點與所述參數(shù)關(guān)系圖中的其余所有節(jié)點均連接,則將所述參數(shù)關(guān)系圖中的所有節(jié)點作為一個節(jié)點集合;
否則,將刪除所述剪枝起始節(jié)點后的參數(shù)關(guān)系圖作為剪枝關(guān)系圖;
從所述剪枝關(guān)系圖中隨機選擇任一節(jié)點,若所述任一節(jié)點與所述剪枝關(guān)系圖中的其余所有節(jié)點均連接,則將所述剪枝關(guān)系圖中的所有節(jié)點作為一個節(jié)點集合,并重新選擇所述剪枝起始節(jié)點;
否則,刪除所述任一節(jié)點,并更新所述剪枝關(guān)系圖。
根據(jù)本發(fā)明提供的一種元事件抽取方法,所述確定待處理文本包含的觸發(fā)詞及其對應的各參數(shù)詞,包括:
對所述待處理文本進行事件觸發(fā)詞分類,得到所述待處理文本中各分詞的觸發(fā)詞類型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥訊飛數(shù)碼科技有限公司,未經(jīng)合肥訊飛數(shù)碼科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110282621.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種赤松茸栽培種簡易快繁方法
- 下一篇:激光雷達及掃地機器人





