[發明專利]基于語言模型的問答匹配方法、系統、設備及存儲介質有效
| 申請號: | 201711482842.5 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN110019736B | 公開(公告)日: | 2021-10-01 |
| 發明(設計)人: | 王穎帥;李曉霞;苗詩雨 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;羅朗 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語言 模型 問答 匹配 方法 系統 設備 存儲 介質 | ||
本發明公開了一種基于語言模型的問答匹配方法、系統、設備及存儲介質,其中方法包括步驟:S1、在接收到提問問題后,從提問數據庫中獲取與所述提問問題匹配的目標問題,然后獲取答案數據庫中與所述目標問題對應的每個答案數據;S2、采用語言模型對所述答案數據進行處理,生成相應的文本特征及行為特征,所述行為特征用于表征所述答案數據的狀態和屬性;S3、采用決策樹模型計算所述文本特征和所述行為特征,并根據計算結果預測所述答案數據的排序結果。本發明通過語言模型和決策樹模型,可以快速、準確地定位出用戶需求和對答案數據智能排序,從而為用戶篩選出最想看的答案,提升用戶體驗。
技術領域
本發明涉及計算機技術領域,特別涉及一種基于語言模型的問答匹配方法、系統、設備及存儲介質。
背景技術
在當今信息時代,計算機作為信息傳遞工具已經逐漸在全球范圍內普及。隨著人工智能的發展,可以讓計算機理解語言,并能對用戶的對話做出有價值的排序。現有技術中,問答系統一般采用以下兩種方法來實現問題與答案的匹配:
(1)問題和答案基于規則的匹配
該方法主要包括字符串匹配查找,正則表達式等,通過編寫復雜的正則表達式規則模板,模擬出每一個語境對應的關鍵詞進行匹配關聯,若提問句不存在對應的匹配規則,就會得到不靠譜的排序;
(2)基于檢索的語料系統,計算詞向量
這種方法通過對句子分詞后形成詞向量,然后根據相似度排序答案,由于算法并沒有真正學習利用語言的內在邏輯關系,有可能有的答案者把問題在答案中復制了一遍,但是基于相似度計算會得到很高的相似度,顯然不能保證用戶體驗。
發明內容
本發明要解決的技術問題是為了克服現有技術中基于規則的問答方法需要復雜的正則表達式且答案可能不靠譜,而基于檢索的語料系統通過計算問答句之間的詞向量相似度,并沒有利用語言的內在邏輯關系,答案可能不靠譜的缺陷,提供一種基于語言模型的問答匹配方法、系統、設備及存儲介質。
本發明是通過下述技術方案來解決上述技術問題:
本發明提供一種基于語言模型的問答匹配方法,其特點是,包括:
S1、在接收到提問問題后,從提問數據庫中獲取與所述提問問題匹配的目標問題,然后獲取答案數據庫中與所述目標問題對應的每個答案數據;
S2、采用語言模型對所述答案數據進行處理,生成相應的文本特征及行為特征,所述行為特征用于表征所述答案數據的狀態和屬性,其中所述行為特征可以為回答狀態、回答問題的用戶的客戶端類型、問題是否被匿名答案、回答的類型、創建問題的答案到現在的時間、回答修改到現在的時間、回答的點贊數、用戶收到問題的次數、用戶收到問題消息次數、用戶點擊提問消息次數、用戶回答次數、用戶被點贊次數和用戶最佳回答次數等特征之中的至少一個。
S3、采用決策樹模型計算所述文本特征和所述行為特征,并根據計算結果預測所述答案數據的排序結果。
較佳地,所述決策樹模型包括GBDT(Gradient Boosting Decision Tree,梯度提升決策樹)模型。
較佳地,所述語言模型包括N-Gram模型(N元統計模型)、神經網絡語言模型和循環神經網絡,所述步驟S2具體包括:
采用所述N-Gram模型將所述答案數據生成相應的答案詞向量;
采用所述神經網絡語言模型訓練所述答案詞向量;
采用所述循環神經網絡訓練所述神經網絡語言模型輸出的結果以獲得所述文本特征及所述行為特征。
較佳地,所述N-Gram模型包括Skip-Gram模型(給定輸入詞項來預測上下文的一種語言處理模型)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711482842.5/2.html,轉載請聲明來源鉆瓜專利網。





