[發明專利]一種智能問答方法及其系統在審
| 申請號: | 201711061534.5 | 申請日: | 2017-11-02 |
| 公開(公告)號: | CN107818164A | 公開(公告)日: | 2018-03-20 |
| 發明(設計)人: | 張邦佐;武志遠;孫小新;馮國忠 | 申請(專利權)人: | 東北師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/04;G10L15/26 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 130024 吉林*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 問答 方法 及其 系統 | ||
1.一種智能問答方法,其特征在于,包括如下步驟:
步驟S1、建立相關領域的知識圖譜;
步驟S2、將用戶問題的語音轉化成文本;
步驟S3、使用skip-gram模型將文本向量化,生成問題向量矩陣;
步驟S4、使用卷積神經網絡將問題向量矩陣生成問題特征向量;
步驟S5、計算用戶問題特征向量與候選答案特征向量的相似度;
步驟S6、通過排序學習反饋給用戶答案。
2.如權利要求1所述的智能問答方法,其特征在于,步驟S1中,知識圖譜的建立包括如下步驟:
步驟R1、對高價值信息進行檢測,抽取數據塊;
步驟R2、將自然語言文本中的信息與知識庫中的條目進行鏈接;
步驟R3、對自然語言文本進行開放抽取,獲取相應的三元組;
步驟R4、將抽取的三元組進行驗證集成。
3.如權利要求1所述的智能問答方法,其特征在于,步驟S3中,skip-gram模型將文本向量化時,對于給定單詞序列w1,w2,...,wn,該模型的優化目標公式如下:
式中,p表示第t+j個詞在t個詞出現的情況下出現的概率;c是訓練上下文的長度;
skip-gram模型使用softmax函數來優化參數,優化公式如下:
式中,νw是單詞w的輸入向量;ν’w是單詞w的輸出向量;W是詞表中單詞的數量。
4.如權利要求3所述的智能問答方法,其特征在于,skip-gram模型優化參數的方法包括:層次softmax、負采樣和二次采樣中的一種或多種。
5.如權利要求1所述的智能問答方法,其特征在于,步驟S4包括如下子步驟:
步驟T1、將問題向量矩陣用二元卷積神經網絡生成卷積神經網絡;
步驟T2、問題向量矩陣經第一卷積層、第一采樣層、第二卷積層和第二采樣層后變換到輸出層,生成問題向量。
6.如權利要求5所述的智能問答系統,其特征在于,問題向量生成模型的訓練目標公式如下:
L=max(mar-xT·x++xT·x-)+(公式3)
其中,x為由卷積神經網絡生成的問題向量;x+為與向量x屬于同一類的抽樣向量;x-為不屬于向量x所屬類的抽樣向量。
7.如權利要求5所述的智能問答方法,其特征在于,問題向量矩陣經由第二采樣層變換到輸出層的函數如下公式所示:
x=W0tanh(y)(公式4)
其中,x表示輸出向量;y表示第二采樣層向量;W0表示加權變換時的權值信息。
8.如權利要求1所述的智能問答方法,其特征在于,步驟S5中,在問題特征向量與候選答案特征向量進行比較時,進行相似度打分,包括問題特征向量相似度打分、問題特征向量與所有答案向量的相似度打分。
9.如權利要求8所述的智能問答方法,其特征在于,問題特征向量與所有答案向量的相似度打分的公式如下:
r'=v·M'·c(公式5)
其中,r’是結果向量,維度與已知答案的格式k相同;ν是待測評問句向量;M’是一個n×k維矩陣,每一列表示一個已知答案的答案向量;C是一個k維向量,向量中每一維表示該維所對應的結果中關鍵字與問題關鍵字的相似程度。
10.一種智能問答系統,其特征在于,包括:
知識建立模塊,用于建立相關領域的知識圖譜;
語音轉化模塊,用于將用戶問題的語音轉化為文本;
問題向量矩陣生成模塊,用于使用skip-gram模型將文本向量化,生成問題向量矩陣;
問題特征向量生成模塊,用于使用卷積神經網絡將問題向量矩陣生成問題特征向量;
相似度對比模塊,用于計算用戶問題特征向量與候選答案特征向量的相似度;
答案生成模塊,用于通過排序學習反饋給用戶答案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北師范大學,未經東北師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711061534.5/1.html,轉載請聲明來源鉆瓜專利網。





