[發(fā)明專利]一種事件檢測方法和裝置有效
| 申請?zhí)枺?/td> | 202010169229.3 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111428511B | 公開(公告)日: | 2023-05-26 |
| 發(fā)明(設計)人: | 徐猛;付驍弈 | 申請(專利權(quán))人: | 北京明略軟件系統(tǒng)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F16/35;G06N3/045;G06N3/049;G06N3/084 |
| 代理公司: | 北京安信方達知識產(chǎn)權(quán)代理有限公司 11262 | 代理人: | 王康;龍洪 |
| 地址: | 100084 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 事件 檢測 方法 裝置 | ||
本申請公開了一種事件檢測方法和裝置,包括:獲得語句的向量化語義表示W(wǎng)1;對向量化語義表示W(wǎng)1進行span劃分,得到多個語義片段;對多個語義片段進行平均池化,得到每個span的表示W(wǎng)2;使用自注意力機制對獲得的每個span的表示W(wǎng)2進行計算,得到每個span的新的語義表示W(wǎng)3;對新的語義表示W(wǎng)3進行span分類,確定每個span是否為一個事件的觸發(fā)詞或事件主體。通過該實施例方案,能夠獲取更加有用的信息,具有較強的實際應用價值;不使用現(xiàn)有的自然語言處理工具,操作簡單,避免了因使用自然語言處理工具而導致的誤差累積的問題,通過劃分span的方式完美解決了序列標注存在的問題,效率更高,適用性更強。
技術(shù)領(lǐng)域
本文涉及事件數(shù)據(jù)處理技術(shù),尤指一種事件檢測方法和裝置。
背景技術(shù)
互聯(lián)網(wǎng)上每天都會產(chǎn)生大量的新聞數(shù)據(jù),描述許多已經(jīng)發(fā)生的事件。但由于事件種類繁多,無法快速而且準確地分辨事件的類型以及事件中的主體。
對發(fā)生的公共事件或者特定行業(yè)內(nèi)所發(fā)生的事件進行區(qū)分和主體識別,不僅有助于實時把握事件的發(fā)展趨勢以及整個行業(yè)的發(fā)展方向,也可輔助高層決策,降低風險,具有重要的實際應用價值和研究意義。
現(xiàn)有進行事件檢測的方法大都輔助使用已有的自然語言處理工具,但是在實際應用中并不能通過這些工具預先處理好。
事件的類型往往可以從一些關(guān)鍵詞中獲取,比如”槍殺”,“襲擊”等,這類詞就被稱為觸發(fā)詞。因此快速準確地識別出這些觸發(fā)詞就極其重要。
現(xiàn)有的識別方法:[1]基于圖神經(jīng)網(wǎng)絡的模型;[2]基于深度學習、注意力機制、序列標注的模型等。
現(xiàn)有方法存在以下缺點:
1、現(xiàn)有方法只進行事件類型檢測即事件觸發(fā)詞,并沒有進行事件主體抽取,任務單一,不具備較強的實際應用價值。
2、現(xiàn)有方法大都使用特定的自然語言處理工具,如Jieba,ltp,standfordNLP等首先對句子進行分詞,建立依存樹,然后再將這些特征輸入模型。缺點在于:首先處理繁瑣,其次這些工具在處理的過程中本身具有一定的誤差,因此在后續(xù)建模分析的過程中會存在誤差累積的問題。
3、基于序列標注的一系列模型很難解決事件主體存在交叉的情況,比如“北京的法院”為一個事件主體(機構(gòu)),但是“北京”本身也是一種主體/實體(地名)。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N事件檢測方法和裝置,能夠獲取更加有用的信息,具有較強的實際應用價值;在數(shù)據(jù)處理和建模的過程中操作簡單,避免了因使用自然語言處理工具而導致的誤差累積的問題;通過劃分span的方式,完美解決了序列標注存在的問題,效率更高,適用性更強。
本申請?zhí)峁┝艘环N事件檢測方法,所述方法可以包括:
獲得語句的向量化語義表示W(wǎng)1;
對所述向量化語義表示W(wǎng)1進行span劃分,得到多個語義片段;
對多個語義片段進行平均池化,得到每個span的表示W(wǎng)2;
使用自注意力機制對獲得的每個span的表示W(wǎng)2進行計算,得到每個span的新的語義表示W(wǎng)3;
對所述新的語義表示W(wǎng)3進行span分類,確定每個span是否為一個事件的觸發(fā)詞或事件主體。
在本申請的示例性實施例中,所述獲得語句的向量化語義表示W(wǎng)1可以包括:通過雙向LSTM網(wǎng)絡模型或BERT模型獲得語句的向量化語義表示W(wǎng)1。
在本申請的示例性實施例中,在通過雙向LSTM網(wǎng)絡獲得語句的向量化語義表示W(wǎng)1之前,所述方法還可以包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京明略軟件系統(tǒng)有限公司,未經(jīng)北京明略軟件系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010169229.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





