[發明專利]基于頭實體預測的實體和關系聯合抽取方法有效
| 申請號: | 202010589302.2 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111832293B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 陳彥如;王浩;陳碩;石靜;高明珠;林幼玲;宋岱松;鄒可欣;陳良銀 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F40/216 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610065 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 實體 預測 關系 聯合 抽取 方法 | ||
1.基于頭實體預測的實體和關系聯合抽取方法,其特征在于:
第一步,針對輸入的內容通過BERT層對其進行編碼,然后再通過Bi-LSTM層得到每個標簽的概率,通過CRF得到最佳的標簽序列,從而識別出頭實體;
第二步,遍歷第一步中識別出的每個頭實體,取其平均向量與原編碼向量相加,然后作為尾實體標注的輸入;
第三步,尾實體識別和關系識別,采用與頭實體識別同樣的模型結構,但是采用不同的標注策略,即將關系融入到尾實體中,進而在識別出尾實體的同時識別出關系,從而得到三元組。
2.如權利要求1所述的基于頭實體預測的實體和關系聯合抽取方法,其特征在于:將實體和關系抽取任務轉化為頭實體標注和尾實體標注的兩個序列標注任務的方法。
3.如權利要求1所述的基于頭實體預測的實體和關系聯合抽取方法,其特征在于:將實體和關系抽取任務轉化為頭實體標注和尾實體標注的兩個序列標注任務后,即通過將關系只融入到頭實體中,或者只融入到尾實體中的方法。
4.如權利要求1所述的基于頭實體預測的實體和關系聯合抽取方法,其特征在于:在進行實體和關系抽取時,將實體和關系抽取任務轉化為頭實體標注和尾實體標注的兩個序列標注任務后,將實體間的關系只融入到尾實體中的方法,在進行序列標注識別尾實體的時候同時得到關系。
5.如權利要求1所述的基于頭實體預測的實體和關系聯合抽取方法,其特征在于:在實體和關系抽取中,將實體和關系抽取任務轉化為頭實體標注和尾實體標注的兩個序列標注任務后,將第一步識別的頭實體的向量的平均值作為第二步識別尾實體時的輸入。
6.如權利要求1所述的基于頭實體預測的實體和關系聯合抽取方法,其特征在于:在訓練的過程中,采取的負采樣的方法,將尾實體向量代替頭實體的向量作為第二階段的輸入時,此時對應的標注標簽全為“o”標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010589302.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種遠程水位識別RTU
- 下一篇:組合式計量稱重裝置





