[發明專利]基于深度學習的問題分類模型訓練方法、分類方法及裝置有效
| 申請號: | 201710375175.4 | 申請日: | 2017-05-24 |
| 公開(公告)號: | CN107291822B | 公開(公告)日: | 2020-03-24 |
| 發明(設計)人: | 鄂海紅;宋美娜;王昕睿;胡鶯夕;趙鑫祿;白楊;王寧 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06N20/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 100876 北京市海淀區西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 問題 分類 模型 訓練 方法 裝置 | ||
本發明公開了一種基于深度學習的問題分類模型訓練方法、問題分類方法以及裝置。其中問題分類模型訓練方法包括:提取問題文本樣本中的特征信息樣本,并生成對應的第一特征向量樣本;對第一特征向量樣本進行空間變換,得到第二特征向量樣本;將第二特征向量樣本輸入至多層卷積神經網絡中的多個卷積層和多個池化層,以通過疊加卷積操作和池化操作,得到第一融合特征向量樣本;將第一融合特征向量樣本輸入至多層卷積神經網絡中的全連接層,得到全局特征向量樣本;根據全局特征向量樣本對Softmax分類器進行訓練,得到問題分類模型。該方法可免去大量人工設計特征的開銷,通過該問題分類模型可以得到更加準確的分類結果,提高了標準問題與答案的定位。
技術領域
本發明涉及計算機與互聯網技術領域,尤其涉及一種基于深度學習的問題分類模型訓練方法、問題分類方法以及裝置。
背景技術
目前的問答系統面臨人力資源消耗大、響應不及時等缺陷。自動問答系統的目標是在給定問題情況下,給出簡短、精確的答案,無論是業界應用還是學術研究,問句的真實意圖分析、問句與答案之間的匹配關系判別仍然是制約自動問答系統性能的兩個關鍵難題。眾所周知,問題分類根據預期答案對問題進行分類,可快速定位標準問題與答案的大概位置。所以,問題分類是自動問答系統中分析問句真實意圖、判別問句與答案匹配關系的重要模塊,問題分類的效率和精度顯著地影響著問答系統的性能。
相關技術中,目前的問題分類研究大多基于機器學習的方法,致力于從問題中提取詞法、句法、語義特征,研究在人工定義特征之上的關系學習,模型的效果很依賴特征的設計,然后應用例如樸素貝葉斯、決策樹、支持向量機、最大熵等各種監督學習的方法來構建分類器,進而進行預測。
但是,目前存在的問題是,機器學習需要人工提取特征,模型的精度很依賴特征的設計,并且,問答系統中用戶的輸入問題通常屬于短文本且用詞多樣、隨意、不規范,人工提取特征很難提取到豐富的語義特征,而且設計的特征不具備通用性,從而導致問題的分類結果不準確,進而影響標準問題與答案的定位,導致用戶體驗變差。
發明內容
本發明的目的旨在至少在一定程度上解決上述的技術問題之一。
為此,本發明的第一個目的在于提出一種基于深度學習的問題分類模型訓練方法。該方法利用深度學習方法,可以自動從原始數據中抽取特征,免去了大量人工設計特征的開銷,并且通過該問題分類模型對用戶的輸入問題進行預測,可以得到更加準確的分類結果,提高了標準問題與答案的定位,提升了用戶體驗。
本發明的第二個目的在于提出一種問題分類方法。
本發明的第三個目的在于提出一種基于深度學習的問題分類模型訓練裝置。
本發明的第四個目的在于提出一種問題分類裝置。
為達到上述目的,本發明第一方面實施例提出的基于深度學習的問題分類模型訓練方法,包括:獲取問題文本樣本;提取所述問題文本樣本中的特征信息樣本,并根據所述特征信息樣本生成對應的第一特征向量樣本;對所述第一特征向量樣本進行空間變換,得到第二特征向量樣本;將所述第二特征向量樣本輸入至多層卷積神經網絡中的多個卷積層和多個池化層,以通過疊加卷積操作和池化操作,得到第一融合特征向量樣本;將所述第一融合特征向量樣本輸入至所述多層卷積神經網絡中的全連接層,得到全局特征向量樣本;根據所述全局特征向量樣本對Softmax分類器進行訓練,得到所述問題分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710375175.4/2.html,轉載請聲明來源鉆瓜專利網。





