[發(fā)明專利]自動問答方法及裝置在審
| 申請?zhí)枺?/td> | 201810502726.3 | 申請日: | 2018-05-23 |
| 公開(公告)號: | CN110597966A | 公開(公告)日: | 2019-12-20 |
| 發(fā)明(設計)人: | 陳華杰 | 申請(專利權)人: | 北京國雙科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332 |
| 代理公司: | 11227 北京集佳知識產(chǎn)權代理有限公司 | 代理人: | 王寶筠 |
| 地址: | 100080 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 用戶問題 自動問答 目標問題 神經(jīng)網(wǎng)絡 問題模型 問題語句 注意力 答案信息 訓練樣本 解釋性 再利用 匹配 | ||
1.一種自動問答方法,其特征在于,包括:
獲取用戶問題語句與候選問題集,其中,所述候選問題集中的問題語句均對應有預設的答案信息;
利用預置的問題模型,從所述候選問題集中確定出與所述用戶問題語句相匹配的問題語句,作為目標問題語句;其中,所述問題模型為,將歷史問題語句作為訓練樣本對注意力神經(jīng)網(wǎng)絡進行訓練得到的;
采用所述目標問題語句對應的答案信息,對所述用戶問題語句進行回應。
2.如權利要求1所述的方法,其特征在于,所述獲取用戶問題語句與候選問題集包括:
獲取用戶問題語句;
采用BM25算法,從預置問題庫中檢索出與所述用戶問題語句相關聯(lián)的至少一條問題語句,作為候選問題集;所述預置問題庫中的問題語句均對應有預設的答案信息。
3.如權利要求1所述的方法,其特征在于,所述利用預置的問題模型,從所述候選問題集中確定出與所述用戶問題語句相匹配的問題語句,作為目標問題語句包括:
利用預置的問題模型,獲取所述用戶問題語句與所述候選問題集中的問題語句的相似度;
將所述候選問題集中所述相似度符合預設相似度條件的問題語句,確定為與所述用戶問題語句相匹配的問題語句,作為目標問題語句。
4.如權利要求1所述的方法,其特征在于,所述問題模型的訓練過程包括:
獲取訓練樣本,所述訓練樣本中包括樣本問題語句;
采用所述樣本問題語句對注意力神經(jīng)網(wǎng)絡進行訓練,得到所述問題模型。
5.如權利要求4所述的方法,其特征在于,所述獲取訓練樣本包括:
獲取第一問題語句;
獲取與所述第一問題語句語義相同的第二問題語句,以及,與所述第一問題語句語義不同的第三問題語句;
將所述第二問題語句作為所述第一問題語句的正樣本,將所述第三問題語句作為所述第一問題語句的負樣本;其中,所述正樣本與所述負樣本為訓練樣本。
6.如權利要求4所述的方法,其特征在于,所述采用所述樣本問題語句對注意力神經(jīng)網(wǎng)絡進行訓練,得到所述問題模型包括:
獲取所述樣本問題語句中各個詞對應的詞向量;
根據(jù)所述詞向量,利用雙向門結構的循環(huán)神經(jīng)網(wǎng)絡,抽取所述樣本問題語句中各個時刻對應的特征向量;
利用注意力機制,確定所述樣本問題語句中各個時刻對應的權重信息;
根據(jù)所述樣本問題語句中各個時刻對應的特征向量與權重信息,確定所述樣本問題語句對應的句向量;
根據(jù)所述句向量,確定所述注意力神經(jīng)網(wǎng)絡的網(wǎng)絡參數(shù),得到所述問題模型。
7.如權利要求6所述的方法,其特征在于,在所述采用所述樣本問題語句對注意力神經(jīng)網(wǎng)絡進行訓練之前,所述方法還包括:
獲取目標領域的文本語句;
對所述文本語句進行分詞處理,得到所述文本語句的分詞結果;
對所述文本語句的分詞結果進行詞向量訓練,得到詞向量模型;
相應的,
所述獲取所述樣本問題語句中各個詞對應的詞向量包括:
對所述樣本問題語句進行分詞處理,得到所述樣本問題語句的分詞結果;
根據(jù)所述詞向量模型,獲取所述樣本問題語句中各個詞對應的詞向量。
8.一種自動問答裝置,其特征在于,包括:
問題獲取單元,用于獲取用戶問題語句與候選問題集,其中,所述候選問題集中的問題語句均對應有預設的答案信息;
問題確定單元,用于利用預置的問題模型,從所述候選問題集中確定出與所述用戶問題語句相匹配的問題語句,作為目標問題語句;其中,所述問題模型為,將歷史問題語句作為訓練樣本對注意力神經(jīng)網(wǎng)絡進行訓練得到的;
問題回應單元,用于采用所述目標問題語句對應的答案信息,對所述用戶問題語句進行回應。
9.一種存儲介質,其特征在于,所述存儲介質包括存儲的程序,其中,在所述程序運行時控制所述存儲介質所在設備執(zhí)行如權利要求1-7中任一項所述的自動問答方法。
10.一種處理器,其特征在于,所述處理器用于運行程序,其中,所述程序運行時執(zhí)行如權利要求1-7中任一項所述的自動問答方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京國雙科技有限公司,未經(jīng)北京國雙科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810502726.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





