[發(fā)明專利]問答方法、裝置、計算機設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011525830.8 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112632248A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設(shè)計)人: | 鄭哲;張秋實;林仕鋒;劉杰 | 申請(專利權(quán))人: | 深圳追一科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/284;G06F40/30;G06K9/62 |
| 代理公司: | 廣州華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 陳小娜 |
| 地址: | 518051 廣東省深圳市南山區(qū)粵海街道*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 問答 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
1.一種問答方法,其特征在于,所述方法包括:
獲取待回答的目標問句;
將所述目標語句輸入到問句識別模型中進行特征提取,得到目標語義表征向量;
獲取所述目標語義表征向量所對應(yīng)的目標向量類別,所述目標向量類別對應(yīng)有多個標準語義表征向量,所述標準語義表征向量是將標準問句輸入所述問句識別模型中進行特征提取得到的;
獲取所述目標向量類別所對應(yīng)的目標知識點,將所述目標知識點對應(yīng)的標準答案作為所述目標問句所對應(yīng)的答案,所述目標知識點對應(yīng)的標準答案為所述標準問句所對應(yīng)的答案。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目標向量類別是從候選向量類別集合中篩選得到的,所述方法還包括:
獲取標準問句集合;
將所述標準問句集合中的各個標準問句輸入到所述問句識別模型中進行特征提取,得到語義表征向量集合,所述語義表征向量集合包括各個所述標準問句對應(yīng)的標準語義表征向量;
對所述語義表征向量集合進行聚類,得到候選向量類別集合;
建立所述候選向量類別集合中各個候選向量類別所對應(yīng)的知識點,與所述候選向量類別所對應(yīng)的標準問句的標準答案的知識對應(yīng)關(guān)系,以基于所述知識對應(yīng)關(guān)系得到所述目標問句所對應(yīng)的答案。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取所述目標語義表征向量所對應(yīng)的目標向量類別包括:
獲取各個所述候選向量類別所對應(yīng)的類別表示向量,所述類別表示向量是基于所述候選向量類別所對應(yīng)的標準語義表征向量得到的;
獲取所述目標語義表征向量與各個所述類別表示向量的向量相似度;
將向量相似度最大的類別表示向量所對應(yīng)的候選向量類別,作為所述目標語義表征向量所對應(yīng)的目標向量類別。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述問句識別模型的訓練步驟包括:
獲取會話中的會話問句以及所述會話問句對應(yīng)的多個答案語句;
基于所述答案語句組成的答案語句集合進行意圖識別,得到所述答案語句集合對應(yīng)的標準意圖;
基于會話問句以及待訓練的問句識別模型,得到所述會話問句所對應(yīng)的預(yù)測意圖;
基于所述標準意圖與所述預(yù)測意圖的差異得到模型損失值,基于所述模型損失值調(diào)整待訓練的問句識別模型的模型參數(shù),得到已訓練的問句識別模型。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述答案語句組成的答案語句集合進行意圖識別,得到所述答案語句集合對應(yīng)的標準意圖包括:
以答案語句為單位對所述答案語句集合中的各個答案語句進行分詞處理,得到各個所述答案語句對應(yīng)的分詞集合,各個所述答案語句對應(yīng)的分詞集合組成答案分詞集合;
基于所述答案分詞集合得到所述答案語句集合對應(yīng)的標準意圖。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述答案分詞集合得到所述答案語句集合對應(yīng)的標準意圖包括:
基于意圖識別模型對所述答案分詞集合進行識別,得到所述答案語句集合所對應(yīng)的標準意圖,所述意圖識別模型為非時間序列模型。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述會話問句為多個,所述基于會話問句以及待訓練的問句識別模型,得到所述會話問句所對應(yīng)的預(yù)測意圖包括:
按照會話順序?qū)λ鰰拞柧溥M行拼接,得到拼接問句;
對所述拼接問句進行分詞處理,按照分詞在所述拼接問句的順序?qū)η蟹值玫降姆衷~進行排列,得到分詞序列;
利用基于時間序列的待訓練問句識別模型對所述分詞序列進行識別,得到所述會話問句所對應(yīng)的預(yù)測意圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳追一科技有限公司,未經(jīng)深圳追一科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011525830.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





