[發明專利]模型訓練方法、問答實現方法、裝置和計算設備在審
| 申請號: | 202110233770.0 | 申請日: | 2021-03-03 |
| 公開(公告)號: | CN113011197A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 盧健 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06F40/35 | 分類號: | G06F40/35 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 任默聞;孫乳筍 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 問答 實現 裝置 計算 設備 | ||
1.一種模型訓練方法,包括:
將至少三個語句輸入至語義表示模型,獲得至少三個向量,所述至少三個語句包括至少兩個用于表示第一語義的第一語句、以及至少一個用于表示第二語義的第二語句;
根據所述至少三個向量,確定損失函數的取值,所述損失函數用于表示第一相似度與第二相似度之間的偏差程度,所述第一相似度用于表示第一語句之間語義的相似程度,所述第二相似度用于表示第一語句與第二語句之間語義的相似程度;
根據損失函數的取值,確定所述語義表示模型的模型參數。
2.如權利要求1所述的方法,所述語義表示模型包括ERNIE模型;所述第一語句和所述第二語句為提問語句;所述第一語義和所述第二語義為提問語句的語義。
3.如權利要求1所述的方法,所述確定損失函數的取值,包括:
根據至少兩個第一語句的向量,計算第一相似度;
根據第一語句的向量和第二語句的向量,計算第二相似度;
根據第一相似度和第二相似度,確定損失函數的取值。
4.如權利要求1或3所述的方法,所述將至少三個語句輸入至語義表示模型,包括:
將三個語句輸入至語義表示模型,獲得三個向量,所述三個語句包括兩個用于表示第一語義的第一語句、以及一個用于表示第二語義的第二語句;
根據公式Loss=max{similarity(V1,V3)-similarity(V1,V2)+α,0},確定損失函數的取值,其中,V1表示一個第一語句的向量,V2表示另一個第一語句的向量,V3表示第二語句的向量,similarity(V1,V2)表示第一相似度,similarity(V1,V3)表示第二相似度,α表示系數。
5.一種問答實現方法,包括:
將目標提問語句輸入至語義表示模型,獲得目標向量;
將目標向量輸入至與所述語義表示模型相連的向量搜索模型,獲得參考向量,所述參考向量為向量集中與所述目標向量之間的距離滿足預設條件的向量,所述向量集包括問答知識庫中提問語句的向量,所述問答知識庫包括具有對應關系的提問語句和答復語句;
利用參考向量,基于所述問答知識庫確定所述目標提問語句對應的答復語句。
6.如權利要求5所述的方法,所述語義表示模型包括ERNIE模型;
所述向量搜索模型包括HNSW模型。
7.如權利要求5所述的方法,所述問答知識庫包括多個問答集,每個問答集包括至少一個提問語句、以及與所述至少一個提問語句相對應的答復語句;
所述基于所述問答知識庫確定所述目標提問語句的答復語句,包括:
利用參考向量,從所述問答知識庫中選取問答集;
根據選取的問答集,確定所述目標提問語句對應的答復語句。
8.如權利要求7所述的方法,所述參考向量的數量為多個,所述問答知識庫中的每個問答集對應有標識;所述從所述問答知識庫中選取問答集,包括:
針對每個參考向量,從所述問答知識庫中選取包含參考向量所對應提問語句的問答集;
所述確定所述目標提問語句對應的答復語句,包括:
以選取的問答集對應的標識所形成的集合為標識集,從所述標識集中選取數量最多的標識,從選取的標識所對應的問答集中獲取答復語句,作為所述目標提問語句對應的答復語句。
9.如權利要求5所述的方法,所述向量集通過如下方式獲得:
將問答知識庫中的提問語句輸入至語義表示模型,獲得向量;
將獲得的向量計入所述向量集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110233770.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種防塵圓柱產品表面拋光設備
- 下一篇:換擋機構及車輛





