[發明專利]一種問題匹配方法和裝置有效
| 申請號: | 201611192472.7 | 申請日: | 2016-12-21 |
| 公開(公告)號: | CN106815311B | 公開(公告)日: | 2021-08-06 |
| 發明(設計)人: | 陳海波;李曉燕 | 申請(專利權)人: | 杭州朗和科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06K9/62 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 310052 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 問題 匹配 方法 裝置 | ||
1.一種問題匹配方法,包括:
接收用戶提交的問題;
針對預設的每個問題集,計算該問題集與用戶提交的問題的相似度;
若所述相似度大于設定相似度閾值,確定該問題集中的待匹配問題與用戶提交的問題相匹配;
其中,同一問題集中保存至少兩個針對同一答案的待匹配問題;
其中,計算該問題集與用戶提交的問題的相似度,包括:
計算該問題集中每個待匹配問題與用戶提交的問題的相似度,其中,計算該問題集中每個待匹配問題與用戶提交的問題的相似度,具體包括:獲得用戶詞序列和每個待匹配問題的詞序列,分別將用戶詞序列與每個待匹配問題對應的待匹配詞序列作為預設深度學習模型的輸入,確定所述預設深度學習模型的輸出;將所述預設深度 學習模型的輸出作為該待匹配問題與用戶提交的問題的相似度;
其中,所述深度學習模型中包括輸入層、詞嵌入層、卷積層、池化層、線性層1、sigmoid層1、線性層2和sigmoid層2;
所述輸入層用于分別將所述用戶詞序列和所述待匹配詞序列轉化為對應的索引序列;所述詞嵌入層用于根據所述用戶詞序列對應的索引序列生成用戶問題矩陣,以及根據所述待匹配詞序列對應的索引序列生成待匹配問題矩陣;所述卷積層用于分別對所述用戶問題矩陣和所述待匹配問題矩陣進行卷積處理;所述池化層用于分別對經過所述卷積層處理后的所述用戶問題矩陣和所述待匹配問題矩陣進行池化處理,以得到對應的向量結果;所述線性層1用于對所述用戶問題矩陣對應的向量結果和所述待匹配問題矩陣對應的向量結果進行拼接處理;所述sigmoid層1用于對所述線性層1的輸出結果進行非線性處理;所述線性層2用于對所述sigmoid層1的輸出結果進行矩陣相乘處理,以得到結果數值;所述sigmoid層2用于對所述結果數值進行非線性處理以得到所述待匹配問題與所述用戶提交的問題的相似度;
根據該問題集中每個待匹配問題與用戶提交的問題的相似度,計算該問題集與用戶提交的問題的相似度;
其中,采用如下公式,計算該問題集與用戶提交的問題的相似度:
其中,probi(Q,Pi)表示問題集Pi與用戶提交的問題Q的相似度,M表示問題集Pi中的待匹配問題的個數,probi(Q,Pij)表示問題集Pi中的問題j與用戶提交的問題Q的相似度。
2.根據權利要求1所述的方法,其中,獲得用戶詞序列和每個待匹配問題的詞序列,包括:
對用戶提交的問題進行分詞處理,得到用戶詞序列;
針對該問題集中的每個待匹配問題,對該待匹配問題進行分詞處理,得到該待匹配問題對應的待匹配詞序列。
3.根據權利要求2所述的方法,其中,采用如下方式訓練得到預設深度學習模型:
利用待訓練深度學習模型,分別計算樣本問題r與各個預設問題集的相似度;
將當前樣本問題r與各個預設問題集的相似度作為預設損失函數的輸入,確定預設損失函數的輸出;
判斷所述預設損失函數的輸出是否小于設定損失閾值;
若否,根據所述預設損失函數的輸出對待訓練深度學習模型中的參數進行更新,將所述待訓練深度學習 模型替換為參數更新后的待訓練深度學習模型,并令r=r+1后,繼續執行上述利用待訓練深度學習模型,分別計算樣本問題r與各個預設問題集的相似度的步驟;
若是,確定所述待訓練深度學習模型為預設深度學習模型。
4.根據權利要求3所述的方法,其中,預設損失函數為:
其中,probi(r,Pi)表示問題集Pi與樣本問題r的相似度,M表示問題集Pi中的待匹配問題的個數,probi(r,Pij)表示問題集Pi中的問題j與樣本問題r的相似度,N表示問題集的個數,ti等于0 或1,當ti=0時表明樣本問題r為負樣本,當ti=1時表明樣本問題r為正樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州朗和科技有限公司,未經杭州朗和科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611192472.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種對海量文檔集的層次聚類方法及系統
- 下一篇:一種駕駛員評價方法及裝置





