[發明專利]一種事件檢測方法和裝置有效
| 申請號: | 202010169229.3 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111428511B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 徐猛;付驍弈 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289;G06F16/35;G06N3/045;G06N3/049;G06N3/084 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 王康;龍洪 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 事件 檢測 方法 裝置 | ||
1.一種事件檢測方法,其特征在于,所述方法包括:
預先將觸發詞的類型劃分為x種,將事件主體的類型劃分為y種,其中,x、y均為正整數;
根據設定的span寬度,對語句進行span劃分,以將語句劃分為多個span,并對每個span進行標記;其中,每個標記表示x+y+1種類型中的任意一種,1表示所述觸發詞的類型和所述事件主體的類型以外的其他類型;
獲得語句的向量化語義表示W1;
對所述向量化語義表示W1進行span劃分,得到多個語義片段;
對多個語義片段進行平均池化,得到每個span的表示W2;
使用自注意力機制對獲得的每個span的表示W2進行計算,得到每個span的新的語義表示W3;
對所述新的語義表示W3進行span分類,包括:使用兩層全連接神經網絡和softmax層對每個span進行分類;
其中,在訓練階段,將分類結果與帶有標記的span進行誤差計算和反向傳播;
確定每個span是否為一個事件的觸發詞或事件主體。
2.根據權利要求1所述的事件檢測方法,其特征在于,所述獲得語句的向量化語義表示W1包括:通過雙向LSTM網絡模型或BERT模型獲得語句的向量化語義表示W1。
3.根據權利要求2所述的事件檢測方法,其特征在于,在通過雙向LSTM網絡獲得語句的向量化語義表示W1之前,所述方法還包括:
將語句中的m個字符隨機初始化為一個維度為[m,n]的n維向量D,其中,對于從0到m-1的索引id,每個id對應一個不同的字符;
對于長度為S的語句,該語句中每一個字符能夠在向量D中找到對應的id,從而獲得維度為[S,D]的向量。
4.根據權利要求3所述的事件檢測方法,其特征在于,通過雙向lstm網絡獲得語句的向量化語義表示W1包括:
將維度為[S,D]的向量輸入預設的雙向LSTM神經網絡,將所述雙向LSTM神經網絡的輸出作為語句的向量化語義表示W1。
5.根據權利要求2所述的事件檢測方法,其特征在于,通過BERT模型獲得語句的向量化語義表示W1包括:
將語句直接輸入所述BERT模型,將所述BERT模型的輸出作為語句的向量化語義表示W1。
6.根據權利要求4或5所述的事件檢測方法,其特征在于,所述向量化語義表示W1的維度為[S,D1];
其中,當通過雙向LSTM網絡獲得語句的向量化語義表示W1時,D1為2*LSTM隱層節點數;當通過BERT模型獲得語句的向量化語義表示W1時,D1=768。
7.根據權利要求1所述的事件檢測方法,其特征在于,所述對所述向量化語義表示W1進行span劃分,得到多個語義片段包括:
獲取設定的span的最大寬度max_span_width;
根據span的寬度從1到max_span_width依次在所述向量化語義表示W1上進行選取,獲得多個span的語義表示span_embedding。
8.一種事件檢測裝置,包括處理器和計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有指令,其特征在于,當所述指令被所述處理器執行時,實現如權利要求1-7任意一項所述的事件檢測方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010169229.3/1.html,轉載請聲明來源鉆瓜專利網。





