[發(fā)明專利]一種構建因果關系確定模型的方法、裝置和設備在審
| 申請?zhí)枺?/td> | 202011379460.1 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112329478A | 公開(公告)日: | 2021-02-05 |
| 發(fā)明(設計)人: | 張茂洪 | 申請(專利權)人: | 北京明略昭輝科技有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/242;G06F40/253;G06N3/04;G06N3/08 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 王曉菲 |
| 地址: | 100082 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 構建 因果關系 確定 模型 方法 裝置 設備 | ||
1.一種構建因果關系確定模型的方法,其特征在于,包括:
獲取原始語料集;所述原始語料集中包括至少一個第一候選文本;
根據(jù)目標事件因果關系模板在所述原始語料集中篩選第二候選文本;
針對每一個第二候選文本,根據(jù)所述第二候選文本中每一個詞的詞向量和每一個字的字向量,確定所述第二候選文本的語句向量;
基于每一個第二候選文本的語句向量對待訓練的因果關系確定模型進行訓練,得到訓練好的因果關系確定模型。
2.根據(jù)權利要求1所述的方法,其特征在于,所述基于每一個第二候選文本的語句向量對待訓練的因果關系確定模型進行訓練,得到訓練好的因果關系確定模型,包括:
針對每一個第二候選文本的語句向量,將所述第二候選文本的語句向量作為正樣本輸入至待訓練的因果關系確定模型,將所述第二候選文本的因果關系標簽作為負樣本輸入至待訓練的因果關系確定模型,對所述待訓練的因果關系確定模型進行訓練;
針對每一個第二候選文本的語句向量,將正樣本輸入至待訓練的因果關系確定模型得到的輸出結果與所述因果關系標簽進行比對,根據(jù)比對結果確定所述待訓練的因果關系確定模型訓練精度,當所述訓練精度達到預設精度值時,訓練結束,得到訓練好的因果關系確定模型。
3.根據(jù)權利要求1所述的方法,其特征在于,所述針對每一個第二候選文本,根據(jù)所述第二候選文本中每一個詞的詞向量和每一個字的字向量,確定所述第二候選文本的語句向量,包括:
針對每一個第二候選文本,基于所述第二候選文本所對應的詞向量和字向量,通過注意力機制生成所述第二候選文本的語句向量。
4.根據(jù)權利要求1所述的方法,其特征在于,所述方法還包括:
獲取待識別文本集合;所述待識別文本集合中包括至少一個待識別文本;
將每一個所述待識別文本分別輸入至訓練好的因果關系確定模型,根據(jù)訓練好的因果關系確定模型的輸出結果確定出具有目標因果關系的目標文本。
5.根據(jù)權利要求4所述的方法,其特征在于,在將每一個所述待識別文本分別輸入至訓練好的目標因果關系確定模型之前,還包括:
針對每一個待識別文本,根據(jù)所述待識別文本中每一個詞的詞向量和每一個字的字向量,確定所述待識別文本的語句向量。
6.根據(jù)權利要求5所述的方法,其特征在于,所述將每一個所述待識別文本分別輸入至訓練好的因果關系確定模型,根據(jù)訓練好的因果關系確定模型的輸出結果確定出具有目標因果關系的目標文本,包括:
將每一個所述待識別文本對應的語句向量分別輸入至訓練好的因果關系確定模型,根據(jù)訓練好的因果關系確定模型的輸出結果確定出具有目標因果關系的目標文本。
7.根據(jù)權利要求4所述的方法,其特征在于,所述訓練好的因果關系確定模型包括特征提取層和判別層;將每一個所述待識別文本分別輸入至訓練好的因果關系確定模型,根據(jù)訓練好的因果關系確定模型的輸出結果確定出具有目標因果關系的目標文本,包括:
針對每一個所述待識別文本,將所述待識別文本輸入至所述特征提取層,得到所述待識別文本的語義特征;
針對每一個所述待識別文本,將所述待識別文本的語義特征輸入至判別層,得到所述待識別文本是否為具有目標因果關系的目標文本。
8.根據(jù)權利要求7所述的方法,其特征在于,所述將所述待識別文本輸入至所述特征提取層,得到所述待識別文本的語義特征,包括:
將所述待識別文本分別輸入至所述特征提取層中的多個濾波器,得到每一個濾波器所對應的濾波結果;
將多個濾波結果中重復率最高的濾波結果確定為所述待識別文本的語義特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略昭輝科技有限公司,未經北京明略昭輝科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011379460.1/1.html,轉載請聲明來源鉆瓜專利網。





