[發明專利]基于多任務孿生網絡的語義匹配方法、裝置、設備和介質有效
| 申請號: | 202010732024.1 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111859986B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 陸林炳;劉志慧;金培根;何斐斐;林加新;李炫 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/279;G06F40/205;G06F16/35 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 唐彩琴 |
| 地址: | 518048 廣東省深圳市福田區益田路503*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 任務 孿生 網絡 語義 匹配 方法 裝置 設備 介質 | ||
本申請涉及人工智能領域,尤其是一種基于多任務孿生網絡的語義匹配方法、裝置、設備和介質。該方法包括:獲取待處理文本及標準文本;將待處理文本輸入至第一特征抽取器中得到待處理文本對應的字量、詞向量及字詞組合向量,將標準文本輸入至第二特征抽取器中得到標準文本對應的字向量、詞向量及字詞組合向量;第一特征抽取器及第二特征抽取器互為孿生網絡;將得到字向量、詞向量及字詞組合向量輸入至預先訓練完成的目標語義匹配模型中,以得到待處理文本和標準文本的目標相似度;根據目標相似度輸出與待處理文本對應的標準文本。此外,本申請還涉及區塊鏈技術,標準文本和目標語義匹配模型可存儲于區塊鏈中。采用本方法能夠提高準確性。
技術領域
本申請涉及人工智能技術領域,特別是涉及一種基于多任務孿生網絡的語義匹配方法、裝置、設備和介質。
背景技術
隨著人工智能技術的發展,出現了自然語言處理技術,其中涉及到語義匹配,即判斷兩個句子是否為相同的意思,通過語義匹配來完成語義匹配任務,即對用戶表達的自然語言進行數據分析處理,識別出用戶實際想表達的深層含義,這樣能夠準確的識別客戶想詢問的內容、了解客戶需要,從而能夠幫助企業快速反應,及時解決客戶問題,從而提高客戶滿意度。
傳統語義匹配采用one-hot編碼或采用預訓練詞向量的方式。但是one-hot編碼在詞袋大小的空間中只有少數維度為1,高維稀疏的空間難以代表句子的語義信息。預訓練詞向量的方式是將詞語映射到低維度稠密空間中,詞語的語義表示方式更加成熟,但是在語言模型任務中訓練出來的語義表征難以適應語義匹配任務的需要,從而導致語義匹配任務的結果不準確。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高準確性的基于多任務孿生網絡的語義匹配方法、裝置、設備和介質。
一種基于多任務孿生網絡的語義匹配方法,所述方法包括:
獲取待處理文本以及標準文本;
將所述待處理文本輸入至第一特征抽取器中,以得到所述待處理文本對應的字量、詞向量以及字詞組合向量,將所述標準文本輸入至第二特征抽取器中,以得到所述標準文本對應的字向量、詞向量以及字詞組合向量;所述第一特征抽取器以及所述第二特征抽取器互為孿生網絡;
將所述待處理文本和所述標準文本對應的字向量、詞向量以及字詞組合向量輸入至預先訓練完成的目標語義匹配模型中,以通過所述目標語義匹配模型計算所述待處理文本和所述標準文本的目標相似度;
根據所述目標相似度輸出與所述待處理文本對應的標準文本。
在其中一個實施例中,所述獲取待處理文本以及標準文本,包括:
獲取待處理文本以及初始標準文本;
按照預設規則提取所述待處理文本的預設數量的字符,并根據所提取的字符進行文本識別確定抽取參數;
根據所述抽取參數從所述初始標準文本中選取標準文本。
在其中一個實施例中,所述抽取參數為關鍵字,所述根據所述抽取參數從所述初始標準文本中選取標準文本包括:
將所述關鍵詞與多個業務類型對應的標準關鍵詞進行匹配;
獲取關鍵詞匹配成功的個數大于預設個數的業務類型作為所述待處理文本對應的業務類型;
根據所述業務類型從所述初始標準文本中選取標準文本。
在其中一個實施例中,所述將所述待處理文本輸入至第一特征抽取器中,以得到所述待處理文本對應的字量、詞向量以及字詞組合向量,將所述標準文本輸入至第二特征抽取器中,以得到所述標準文本對應的字向量、詞向量以及字詞組合向量,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010732024.1/2.html,轉載請聲明來源鉆瓜專利網。





