[發明專利]語義匹配方法、系統、設備及存儲介質在審
| 申請號: | 202011230122.1 | 申請日: | 2020-11-06 |
| 公開(公告)號: | CN112287085A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 許強 | 申請(專利權)人: | 中國平安財產保險股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 謝閱 |
| 地址: | 518000 廣東省深圳市福田區益田路*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語義 匹配 方法 系統 設備 存儲 介質 | ||
1.一種語義匹配方法,其特征在于,包括步驟:
接收問題信息,并對所述問題信息進行預處理生成問題文本;
將所述問題文本分別輸入預設召回模型中,召回多個與所述問題文本相似的預設問題模板;
將召回的多個所述預設問題模板輸入預設語言模型中,生成與各所述預設問題模板相對應的句向量;
獲取所述問題信息對應的業務場景,確定所述業務場景對應的已訓練精排模型;
將各所述預設問題模板相對應的句向量輸入與所述問題信息對應的已訓練精排模型中,以對多個與所述問題文本相似的預設問題模板進行相似度排序,將與所述問題文本相似度最高的預設問題模板設置為與所述問題信息匹配。
2.根據權利要求1所述的語義匹配方法,其特征在于,所述將所述問題文本分別輸入預設召回模型中,召回多個與所述問題文本相似的預設問題模板的步驟包括:
將所述問題文本輸入至少兩個預設召回模型中,每個所述預設召回模型輸出預設個數的召回結果,其中,多個所述預設召回模型分別為采用不同預設規則訓練的召回模型;
根據與各所述預設召回模型對應的召回結果確定多個與所述問題文本相似的預設問題模板。
3.根據權利要求2所述的語義匹配方法,其特征在于,所述將所述問題文本輸入至少兩個預設召回模型中,每個所述預設召回模型輸出預設個數的召回結果的步驟包括:
將所述問題文本輸入第一預設召回模型,生成與所述問題文本的句型和詞組相似的多個預設問題模板;
將所述問題文本輸入第二預設召回模型,生成與所述問題文本的語義相似的多個預設問題模板,其中,所述第一預設召回模型和第二預設召回模型為分別基于同一全量數據庫訓練的召回模型,所述全量數據庫中包括多個預設問題。
4.根據權利要求3所述的語義匹配方法,其特征在于,所述將召回的多個所述預設問題模板輸入預設語言模型中,生成與各所述預設問題模板相對應的句向量的步驟包括:
分別將各召回的預設問題模板輸入預設語言模型中,所述預設語言模型為部署于GUP上的已訓練bert模型;
已訓練bert模型輸出與各所述預設問題模板相對應的句向量。
5.根據權利要求4所述的語義匹配方法,其特征在于,所述將召回的多個預設問題模板輸入預設語言模型中,生成與各所述預設問題模板相對應的句向量的步驟之前,還包括:
獲取第一樣本數據,所述第一樣本數據包括多個業務場景對應的多個問題樣本和與各所述問題樣本對應訓練文本;
構建所述問題樣本和與各所述問題樣本對應的訓練文本形成正樣本句子對和負樣本句子對,生成訓練語料;
將所述訓練語料輸入待訓練的bert模型進行模型訓練,生成已訓練bert模型。
6.根據權利要求5所述的語義匹配方法,其特征在于,所述獲取所述問題信息對應的業務場景,確定所述業務場景對應已訓練精排模型的步驟之前包括:
獲取第二樣本數據,所述第二樣本數據為與業務場景對應的多個問題樣本;
將所述第二樣本數據的各問題樣本輸入已訓練bert模型中輸出與各問題樣本對應的句向量,根據句向量生成訓練樣本;
將所述訓練樣本輸入待訓練的精排模型進行模型訓練,生成與所述第二樣本數據對應的業務場景所對應的已訓練精排模型。
7.根據權利要求6所述的語義匹配方法,其特征在于,所述將與所述問題文本相似度最高的預設問題模板設置與所述問題信息匹配的步驟之后,還包括:
獲取與所述問題信息匹配的預設問題模板對應的預設回答;
將所述預設回答發送至所述問題信息的發送端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安財產保險股份有限公司,未經中國平安財產保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011230122.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種碳量子點薄膜的制備方法
- 下一篇:一種用方向盤檢測酒駕行為的方法和裝置





