[發明專利]一種基于BERT的交互性元學習事件檢測方法在審
| 申請號: | 202211476055.0 | 申請日: | 2022-11-23 |
| 公開(公告)號: | CN115712702A | 公開(公告)日: | 2023-02-24 |
| 發明(設計)人: | 戶保田;陶靖樅;劉振宇 | 申請(專利權)人: | 哈爾濱工業大學(深圳) |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/126;G06F40/194 |
| 代理公司: | 深圳市君勝知識產權代理事務所(普通合伙) 44268 | 代理人: | 陳專 |
| 地址: | 518055 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 bert 交互 學習 事件 檢測 方法 | ||
本發明公開了一種基于BERT的交互性元學習事件檢測方法。方法包括:獲取目標支持集,所述目標支持集包括至少一個參考數據集,所述參考數據集中包括至少一條參考數據;獲取目標數據;將所述目標支持集與所述目標數據進行拼接編碼,得到所述目標數據對應的事件類型;獲取目標參考數據集,所述目標參考數據集對應的事件類型與所述目標數據對應的事件類型相同,將所述目標參考數據集與所述目標數據進行拼接編碼,得到所述目標數據中的事件觸發詞。本發明提供的基于BERT的交互性元學習事件檢測方法,能更好的檢測句子中的事件單詞,提高對檢測句子中事件單詞的準確性。
技術領域
本發明涉及文字檢測技術領域,特別涉及一種基于BERT的交互性元學習事件檢測方法。
背景技術
隨著網絡技術的大規模普及,互聯網每時每刻都在產生著海量的自然語言數據,將事件信息從自然語言中抽取出來已經成為一個重要應用場景。然而由于事件的標注成本較高,并且在實際應用場景中有些事件如政變,經濟危機等缺乏標注語料,因此在某些場景中事件抽取任務難以獲得大量的標注數據來訓練模型。事件檢測作為事件抽取的重要子任務,如何通過少量數據獲得更好效果的模型成為一個亟待解決的問題。
現有的小樣本事件檢測技術多數基于元學習架構,即模型需要從一個由少量標注數據組成的支持集上,學習到事件特征,然后使用學習到的知識在由未標注數據組成的查詢集上進行推理。目前,相關技術一般聚焦于使用各種復雜的網絡結構獲得更好的支持集編碼以及查詢集編碼,如使用 CNN,RNN,GCN等多種神經網絡來對支持集進行編碼得到各個事件類型的原型,或者是設計一種基于記憶力機制的特征編碼方式來得到魯棒性強的句子編碼,還有的通過使用序列標注任務來做事件檢測模型,借鑒CRF轉移矩陣的思想,將轉移分數引入模型,設計端到端的事件檢測模型。
然而,這些模型都只側重于設計復雜的網絡結構,僅僅只是單獨的對支持集與查詢集進行編碼,在編碼過程中,支持集看不到來自查詢集的信息,查詢集也看不到來自支持集的信息,得到的句子編碼缺乏足夠豐富的語意信息,查詢結果不夠準確。
因此,現有技術還有待改進和提高。
發明內容
針對現有技術的上述缺陷,提供一種基于BERT的交互性元學習事件檢測方法及相關設備,旨在解決現有技術中在進行小樣本事件檢測時,句子編碼缺乏足夠豐富的語意信息,查詢結果不夠準確的問題。
本發明的第一方面,提供一種基于BERT的交互性元學習事件檢測方法,包括:
獲取目標支持集,所述目標支持集包括至少一個參考數據集,所述參考數據集中包括至少一條參考數據,所述參考數據為標注了事件觸發詞和事件類型的句子;
獲取目標數據,所述目標數據為未標注事件觸發詞的句子;
將所述目標支持集與所述目標數據進行拼接編碼,得到所述目標數據對應的事件類型;
獲取目標參考數據集,所述目標參考數據集對應的事件類型與所述目標數據對應的事件類型相同,將所述目標參考數據集與所述目標數據進行拼接編碼,得到所述目標數據中的事件觸發詞。
所述的基于BERT的交互性元學習事件檢測方法,其中,所述目標支持集包含至少一種事件類型,每一種事件類型對應一個所述參考數據集;
所述目標支持集的表達式為:
其中,S為所述目標支持集,N為所述參考數據集數量,K為每組所述參考數據集中的參考數據數量,對于每條所述參考數據為第i 個所述參考數據集中的第j個所述參考數據對應的句子,為第i個所述參考數據集中的第j個所述參考數據中的觸發詞對應的位置,ei為第i個所述參考數據集對應的事件類型。
所述的基于BERT的交互性元學習事件檢測方法,其中,所述將所述目標支持集與所述目標數據進行拼接編碼,得到所述目標數據對應的事件類型,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學(深圳),未經哈爾濱工業大學(深圳)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211476055.0/2.html,轉載請聲明來源鉆瓜專利網。





