[發明專利]基于新聞文本的商業事件檢測方法、檢測器及設備在審
| 申請號: | 202310626580.4 | 申請日: | 2023-05-30 |
| 公開(公告)號: | CN116663550A | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 程思偉 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F40/211;G06F40/169;G06N3/042;G06N3/0464;G06N3/045;G06N3/0442;G06N3/0475;G06N3/094 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 劉飛;葉明川 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 新聞 文本 商業 事件 檢測 方法 檢測器 設備 | ||
1.一種基于新聞文本的商業事件檢測方法,其特征在于,包括:
從新聞文本中獲取目標句子的分詞序列;
利用商業事件檢測器的句子編碼層,將所述分詞序列編碼為含有詞性信息的BERT詞向量;
利用所述商業事件檢測器的句法圖卷積層,從所述BERT詞向量中根據句法關系捕捉所述目標句子的長距離依賴特征,獲得第二詞向量;
利用所述商業事件檢測器的雙向長短期記憶層,從所述第二詞向量中根據時序關系捕捉所述目標句子的長距離依賴特征,獲得第三詞向量;
利用所述商業事件檢測器的全連接層,從所述第三詞向量中識別所述目標句子的事件觸發詞及其所屬的事件類型。
2.如權利要求1所述的基于新聞文本的商業事件檢測方法,其特征在于,所述從新聞文本中獲取目標句子的分詞序列,包括:
對新聞文本中的目標句子進行分詞處理,獲得所述目標句子的分詞序列。
3.如權利要求1所述的基于新聞文本的商業事件檢測方法,其特征在于,將所述分詞序列編碼為含有詞性信息的BERT詞向量,包括:
根據所述分詞序列生成詞嵌入、位置嵌入和句子嵌入,并對所述詞嵌入進行詞性標注;
將所述位置嵌入、所述句子嵌入及標注有詞性的詞嵌入輸入BERT模塊,獲得含有詞性信息的BERT詞向量。
4.如權利要求1所述的基于新聞文本的商業事件檢測方法,其特征在于,從所述BERT詞向量中根據句法關系捕捉所述目標句子的長距離依賴特征,包括:
基于所述BERT詞向量構建句法分析樹;所述句法分析樹中包含正向句法弧、反向句法弧和自循環句法弧;
根據所述正向句法弧、所述反向句法弧和所述自循環句法弧,計算所述句法分析樹中各個節點的圖卷積向量,以作為第二詞向量。
5.如權利要求1所述的基于新聞文本的商業事件檢測方法,其特征在于,所述利用所述商業事件檢測器的雙向長短期記憶層,從所述第二詞向量中根據時序關系捕捉所述目標句子的長距離依賴特征,包括:
根據所述第二詞向量的正向時序關系生成正向隱向量,并根據所述第二詞向量的反向時序關系生成反向隱向量;
將所述正向隱向量和所述反向隱向量組合為第三詞向量。
6.如權利要求1所述的基于新聞文本的商業事件檢測方法,其特征在于,所述事件類型為基于擴展ACE事件類型形成的商業事件類型詞典中的元素之一。
7.如權利要求1所述的基于新聞文本的商業事件檢測方法,其特征在于,所述商業事件檢測器預先基于生成對抗網絡和Q學習的獎勵機制訓練得到;所述商業事件檢測器對應的訓練模型為所述生成對抗網絡的生成器。
8.如權利要求7所述的基于新聞文本的商業事件檢測方法,其特征在于,所述訓練的損失函數,包括:
其中,J為最大化獎勵總和的損失,N是訓練語料庫中的句子總數;np是被標記事件類型標簽的詞的個數,Q'(xt,pt)為附加獎勵值的Q值,Q(xt,pt)為當前Q值,xt為生成器在當前t時刻的特征信息,pt為生成器在當前t時刻的狀態。
9.一種商業事件檢測器,其特征在于,包括:
文本輸入層,用于從新聞文本中獲取目標句子的分詞序列;
句子編碼層,用于將所述分詞序列編碼為含有詞性信息的BERT詞向量;
句法圖卷積層,用于從所述BERT詞向量中根據句法關系捕捉所述目標句子的長距離依賴特征,獲得第二詞向量;
雙向長短期記憶層,用于從所述第二詞向量中根據時序關系捕捉所述目標句子的長距離依賴特征,獲得第三詞向量;
全連接層,用于從所述第三詞向量中識別所述目標句子的事件觸發詞及其所屬的事件類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310626580.4/1.html,轉載請聲明來源鉆瓜專利網。





