[發明專利]基于多任務孿生網絡的語義匹配方法、裝置、設備和介質有效
| 申請號: | 202010732024.1 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111859986B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 陸林炳;劉志慧;金培根;何斐斐;林加新;李炫 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/279;G06F40/205;G06F16/35 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 唐彩琴 |
| 地址: | 518048 廣東省深圳市福田區益田路503*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 任務 孿生 網絡 語義 匹配 方法 裝置 設備 介質 | ||
1.一種基于多任務孿生網絡的語義匹配方法,其特征在于,所述方法包括:
獲取待處理文本以及標準文本;
將所述待處理文本輸入至第一特征抽取器中,以得到所述待處理文本對應的字向量、詞向量以及字詞組合向量,將所述標準文本輸入至第二特征抽取器中,以得到所述標準文本對應的字向量、詞向量以及字詞組合向量;所述第一特征抽取器以及所述第二特征抽取器互為孿生網絡;
將所述待處理文本和所述標準文本對應的字向量、詞向量以及字詞組合向量輸入至預先訓練完成的目標語義匹配模型中,以通過所述目標語義匹配模型計算所述待處理文本和所述標準文本的目標相似度;
根據所述目標相似度輸出與所述待處理文本對應的標準文本;
獲取所述標準文本對應的標準答案或鏈接或處理流程;
所述獲取待處理文本以及標準文本,包括:
獲取待處理文本以及初始標準文本;
提取所述待處理文本的前預設數量的字符,并根據所提取的字符進行文本識別確定抽取參數,所述抽取參數包括通過語言確定的業務地區或通過關鍵詞確定的業務類型;
根據所述抽取參數從所述初始標準文本中選取標準文本;
所述將所述待處理文本輸入至第一特征抽取器中,以得到所述待處理文本對應的字向量、詞向量以及字詞組合向量,將所述標準文本輸入至第二特征抽取器中,以得到所述標準文本對應的字向量、詞向量以及字詞組合向量,包括:
將所述待處理文本輸入至第一特征抽取器中,以通過所述第一特征抽取器對所述待處理文本進行分詞處理和分字處理,得到與所述待處理文本對應的字序列和詞序列;
根據與所述待處理文本對應的字序列和詞序列生成所述待處理文本對應的字向量、詞向量以及字詞組合向量;
將所述標準文本輸入至第二特征抽取器中,以通過所述第二特征抽取器對所述標準文本進行分詞處理和分字處理,得到與所述標準文本對應的字序列和詞序列;
根據與所述標準文本對應的字序列和詞序列生成所述標準文本對應的字向量、詞向量以及字詞組合向量;
所述根據與所述待處理文本對應的字序列和詞序列生成所述待處理文本對應的字向量、詞向量以及字詞組合向量,包括:
并行將與所述待處理文本對應的字序列、詞序列以及字詞組合序列輸入至預設神經網絡中得到所述待處理文本對應的字向量、詞向量以及字詞組合向量;
所述根據與所述標準文本對應的字序列和詞序列生成所述標準文本對應的字向量、詞向量以及字詞組合向量,包括:
并行將與所述標準文本對應的字序列、詞序列以及字詞組合序列輸入至預設神經網絡中得到所述標準文本對應的字向量、詞向量以及字詞組合向量。
2.根據權利要求1所述的方法,其特征在于,所述根據所述抽取參數從所述初始標準文本中選取標準文本包括:
將所述關鍵詞與多個業務類型對應的標準關鍵詞進行匹配;
獲取關鍵詞匹配成功的個數大于預設個數的業務類型作為所述待處理文本對應的業務類型;
根據所述業務類型從所述初始標準文本中選取標準文本。
3.根據權利要求1或2所述的方法,其特征在于,所述獲取待處理文本以及標準文本,包括:
接收終端發送的業務處理請求;
提取所述業務處理請求中的初始文本;
根據所述初始文本的句子類型對所述初始文本進行預處理得到待處理文本。
4.根據權利要求1或2所述的方法,其特征在于,所述方法還包括:
獲取訓練文本、標準文本以及預先標注的所述訓練文本與所述標準文本之間的對應關系;
將所述訓練文本輸入至第一特征抽取器中,以得到所述訓練文本對應的字向量、詞向量以及字詞組合向量,將和所述標準文本輸入至第二特征抽取器中,以得到所述標準文本對應的字向量、詞向量以及字詞組合向量,所述第一特征抽取器以及所述第二特征抽取器互為孿生網絡;
將所述訓練文本和所述標準文本對應的字向量、詞向量以及字詞組合向量輸入至初始語義匹配模型中,分別計算字向量、詞向量以及字詞組合向量對應的相似度,并根據所計算得到的相似度與預先標注的對應關系計算得到各自對應的損失函數;
根據字向量、詞向量以及字詞組合向量的損失函數得到目標損失函數,并根據所述目標損失函數通過梯度反向傳播,對所述初始語義匹配模型進行參數調整,得到目標語義匹配模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010732024.1/1.html,轉載請聲明來源鉆瓜專利網。





