[發明專利]一種面向用戶的多輪問答法律文書實體關系抽取方法在審
| 申請號: | 202110058268.0 | 申請日: | 2021-01-16 |
| 公開(公告)號: | CN112732942A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 李參宏 | 申請(專利權)人: | 江蘇網進科技股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/332;G06F40/126;G06F40/295;G06Q50/18 |
| 代理公司: | 蘇州佳博知識產權代理事務所(普通合伙) 32342 | 代理人: | 唐毅 |
| 地址: | 215300 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 用戶 問答 法律文書 實體 關系 抽取 方法 | ||
1.一種面向用戶的多輪問答法律文書實體關系抽取方法,其特征在于:問題模板引擎提供的問題展示給用戶,在獲取用到戶選擇的問題后,判斷是否存儲過該文書的該問題,若有,直接輸出答案;若無,將其問題分析,對該問題進行分析處理,得到答案,輸出并存儲該文書的問題及答案;將輸出的答案傳入到前端進行顯示,根據答案動態選擇之后的問題模板序列;之后重復上述過程直到用戶無輸入為止;其中,分析處理的方法步驟包括:
通過卷積和注意力把問題編碼為一個固定的向量,將其拼接到文書的每個詞向量中;在詞向量中拼接位置向量、人工特征,得到一個混合了問題、文書信息的特征序列;接多層卷積進行編碼處理,然后使用BEMO的序列標注方法直接對序列進行標注;每個詞的表示反饋給sigmoid層來輸出BMEO標簽,獲得答案的位置標記。
2.如權利要求1所述的面向用戶的多輪問答法律文書實體關系抽取方法,其特征在于:卷積方法是基于如下模型的卷積過程完成的:
其中,X=[x1,x2,…,xn]是將要處理的向量序列,Conv1D1與Conv1D2是兩個卷積核數窗口大小都一樣的一維卷積,σ是sigmoid激活函數。
3.如權利要求1所述的面向用戶的多輪問答法律文書實體關系抽取方法,其特征在于:
注意力方法是通過如下的卷積過程完成的:
其中,α,W是可訓練參數,Act是激活函數。
4.如權利要求1所述的面向用戶的多輪問答法律文書實體關系抽取方法,其特征在于:位置向量構造方法為:
上式表示將id為p的位置映射成一個dpos維的位置向量,這個向量的第i個元素的數值記為PEi(p)。
5.如權利要求1所述的面向用戶的多輪問答法律文書實體關系抽取方法,其特征在于:通過訓練提取頭部實體和提取尾部實體及關系這兩個階段的目標函數,進一步提升實體關系抽取性能:
其中,λ∈[0,1]是控制兩個目標函數之間權衡的參數,表示提取頭部實體這一階段的目標函數,表示提取尾部實體和關系這一階段的目標函數;兩個階段的目標函數都是用如下的目標函數:P(wi|w1,...,wi-1,wi+1,...,wn);其中wi表示的是句子中第i個位置的詞拼接后的向量表示。
6.如權利要求5所述的面向用戶的多輪問答法律文書實體關系抽取方法,其特征在于:對于基于BEMO標注輸出的方法,即選擇一個文本段{w1,w2,...wn}的概率,定義為一個聯合概率:
其中,B,E,M為BEM0標記。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇網進科技股份有限公司,未經江蘇網進科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110058268.0/1.html,轉載請聲明來源鉆瓜專利網。





