[發明專利]基于雙向長短期記憶神經網絡的智能自動問答方法及系統在審
| 申請號: | 201811478881.2 | 申請日: | 2018-12-05 |
| 公開(公告)號: | CN109299478A | 公開(公告)日: | 2019-02-01 |
| 發明(設計)人: | 馮俊龍;劉妍;周超然;張昕;馮欣;趙建平;張劍飛;張婧;孫庚 | 申請(專利權)人: | 長春理工大學 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/332;G06F16/335;G06N3/08 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 程華 |
| 地址: | 130000 吉林*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 記憶神經網絡 自動問答 智能 匹配 用戶目標向量 目標向量 用戶問題 特征詞 相似度 數據庫 矩陣 語義 核心特征 獲取信息 矩陣輸入 問題答案 問題文本 構建 向量 答案 轉化 | ||
1.一種基于雙向長短期記憶神經網絡的智能自動問答方法,其特征在于,所述智能自動問答方法包括:
對所有自動問答數據中的問題文本進行切詞與向量轉化處理,使每一個所述問題文本均轉化成一個問題矩陣;
構建雙向長短期記憶神經網絡模型;
將所述問題矩陣依次輸入到所述雙向長短期記憶神經網絡模型中,所述雙向長短期記憶神經網絡模型依次輸出所述問題矩陣對應的目標向量,并將所有所述目標向量存儲到智能自動問答數據庫中;所述智能自動問答數據庫包括問題文本、問題文本對應的目標向量以及問題文本對應的問題答案;
獲取用戶輸入問題文本;
對所述用戶輸入問題文本進行切詞與向量轉化處理,得到特征詞和用戶問題矩陣;
從所述智能自動問答數據庫中提取與所述特征詞相匹配的問題列表;
將所述用戶問題矩陣輸入到所述雙向長短期記憶神經網絡模型,得到用戶目標向量;
計算所述用戶目標向量與所述問題列表中每個目標向量的相似度,并將相似度最高的目標向量對應的問題答案確定為用戶所需答案。
2.根據權利要求1所述的智能自動問答方法,其特征在于,所述對所有自動問答數據中的問題文本進行切詞與向量轉化處理,使每一個所述問題文本均轉化成一個問題矩陣,具體包括:
構建詞向量模型庫;
將所有自動問答數據中的每個問題文本進行切詞處理,得到多個詞;
將每個所述問題文本中的每個詞與所述詞向量模型庫中的詞進行匹配,若所述問題文本中的詞與所述詞向量模型庫中的詞匹配成功,則保留與所述詞向量模型庫中的詞匹配成功的詞,若所述問題文本中的詞與所述詞向量模型庫中的詞匹配不成功,則將與所述詞向量模型庫中的詞匹配不成功的詞替換為0;
將每個問題文本中存在的每個0和保留下的每個詞均轉化為一個長度為300的向量;
將所有所述向量組合,得到每個問題文本對應的問題矩陣;所述問題矩陣為n*300;n表示所有所述問題文本中字數最長的字數。
3.根據權利要求2所述的智能自動問答方法,其特征在于,所述將每個問題文本中存在的每個0和保留下的每個詞均轉化為一個長度為300的向量,具體包括:
采用開源詞向量模型chinese-word-vectors,將每個問題文本中存在的每個0和保留下的每個詞均轉化為一個長度為300的向量。
4.根據權利要求2所述的智能自動問答方法,其特征在于,在將每個所述問題文本中的每個詞與所述詞向量模型庫中的詞進行匹配之前,還包括:
將所有所述問題文本中字數最長的字數n設置為問題文本統一處理長度;
提取問題文本字數低于n的問題文本,并將字數低于字數n的問題文本用0補齊,使每個問題文本的字數均為n。
5.根據權利要求2所述的智能自動問答方法,其特征在于,所述構建雙向長短期記憶神經網絡模型,具體包括:
采用TensorFlow第三方庫進行雙向長短期記憶神經網絡搭建;
確定模型參數和調用函數;
根據所述模型參數、所述調用函數、所述雙向長短期記憶神經網絡,構建雙向長短期記憶神經網絡模型;所述雙向長短期記憶神經網絡模型的輸入為n*300的矩陣;所述雙向長短期記憶神經網絡模型的輸出為一個17維的向量。
6.根據權利要求1所述的智能自動問答方法,其特征在于,所述計算所述用戶目標向量與所述問題列表中每個目標向量的相似度,并將相似度最高的目標向量對應的問題答案確定為用戶所需答案,具體包括:
采用余弦相似函數,計算所述用戶目標向量與所述問題列表中每個目標向量的相似度,并將相似度最高的目標向量對應的問題答案確定為用戶所需答案。
7.根據權利要求6所述的智能自動問答方法,其特征在于,所述余弦相似函數為其中,S(s1,s2)表示相似度得分,s1表示所述用戶目標向量,s2表示所述問題列表中的目標向量,T表示轉置。
8.一種基于雙向長短期記憶神經網絡的智能自動問答系統,其特征在于,所述智能自動問答系統包括:
問題矩陣得到模塊,用于對所有自動問答數據中的問題文本進行切詞與向量轉化處理,使每一個所述問題文本均轉化成一個問題矩陣;
雙向長短期記憶神經網絡模型構建模塊,用于構建雙向長短期記憶神經網絡模型;
目標向量存儲模塊,用于將所述問題矩陣依次輸入到所述雙向長短期記憶神經網絡模型中,所述雙向長短期記憶神經網絡模型依次輸出所述問題矩陣對應的目標向量,并將所有所述目標向量存儲到智能自動問答數據庫中;所述智能自動問答數據庫包括問題文本、問題文本對應的目標向量以及問題文本對應的問題答案;
用戶輸入問題文本獲取模塊,用于獲取用戶輸入問題文本;
特征詞和用戶問題矩陣得到模塊,用于對所述用戶輸入問題文本進行切詞與向量轉化處理,得到特征詞和用戶問題矩陣;
問題列表提取模塊,用于從所述智能自動問答數據庫中提取與所述特征詞相匹配的問題列表;
用戶目標向量得到模塊,用于將所述用戶問題矩陣輸入到所述雙向長短期記憶神經網絡模型,得到用戶目標向量;
用戶所需答案確定模塊,用于計算所述用戶目標向量與所述問題列表中每個目標向量的相似度,并將相似度最高的目標向量對應的問題答案確定為用戶所需答案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長春理工大學,未經長春理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811478881.2/1.html,轉載請聲明來源鉆瓜專利網。





