[發明專利]一種自動生成法律文本標記事件的方法有效
| 申請號: | 202110058260.4 | 申請日: | 2021-01-16 |
| 公開(公告)號: | CN112733507B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 蘭莉;周振東 | 申請(專利權)人: | 江蘇網進科技股份有限公司 |
| 主分類號: | G06F40/169 | 分類號: | G06F40/169;G06F40/211;G06F40/247;G06F40/289;G06Q50/18 |
| 代理公司: | 蘇州佳博知識產權代理事務所(普通合伙) 32342 | 代理人: | 唐毅 |
| 地址: | 215300 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自動 生成 法律 文本 標記 事件 方法 | ||
1.一種自動生成法律文本標記事件的方法,其特征在于,其步驟包括:
步驟S101,輸入初始的法律文本數據進行預處理,識別事件的觸發詞、事件的參數、事件類型;
步驟S102,根據識別的事件參數與事件類型,使用GPT模型獲取新的事件參數,獲取新的事件參數,具體滿足下述條件:
其中,a表示事件的參數向量,β表示使用GPT模型生成的嵌入,t表示識別的事件參數;
步驟S103,根據識別的觸發詞與事件類型,通過BERT模型根據輸入的數據生成能夠表示同一種事件發生的詞語作為新的觸發詞,其中,所述新的觸發詞為與初始法律文本數據中觸發詞意思相近,符合識別的觸發詞上下文語境,能夠表示同一種事件發生的詞語;
步驟S104,根據新的觸發詞與新的事件參數,生成新的法律文本標記事件;
步驟S105,對新的法律文本標記事件進行評價;
步驟S106,從評價完成的法律文本標記事件中選出評價符合標準的法律文本標記事件。
2.如權利要求1所述的自動生成法律文本標記事件的方法,其特征在于,上述步驟S105中,針對新的法律文本標記事件進行評價,其步驟包括:
(1)獲取生成標記事件的合理性R(S′),具體滿足:
其中,R(S')表示新生成標記事件S′的合理性分數,S′表示重寫過的句子,P(t)表示重寫事件參數t的概率,A(S')表示在句子S′中調整過后的新的事件參數;
(2)獲取生成的標記事件和原有的標記事件之間的偏差度D(S′),具體滿足:
其中,D(S')表示重寫過的句子與原有句子之間的偏差度,D表示原有的數據集,B(S)生成標記事件句子的元素集合的特征向量化處理,B(S’)表示原有標記事件句子的元素集合的特征向量化處理,||表示對向量化后的文本進行取模操作;
(3)根據所述生成標記事件的合理性與偏差度計算最終標記事件的評價分數,評價分數Q(S′)滿足:Q(S′)=1-((1-λ)R(S′)+λD(S′)),其中,Q(S')為新生成標記事件S'的評價分數,μ、λ為自定義的平衡調節參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇網進科技股份有限公司,未經江蘇網進科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110058260.4/1.html,轉載請聲明來源鉆瓜專利網。





