[發明專利]一種問題匹配方法和裝置有效
| 申請號: | 201611192472.7 | 申請日: | 2016-12-21 |
| 公開(公告)號: | CN106815311B | 公開(公告)日: | 2021-08-06 |
| 發明(設計)人: | 陳海波;李曉燕 | 申請(專利權)人: | 杭州朗和科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06K9/62 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 310052 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 問題 匹配 方法 裝置 | ||
本發明的實施方式提供了一種問題匹配方法。該方法包括:接收用戶提交的問題;針對預設的每個問題集,計算該問題集與用戶提交的問題的相似度;若所述相似度大于設定相似度閾值,確定該問題集中的待匹配問題與用戶提交的問題相匹配;其中,同一問題集中保存至少兩個針對同一答案的待匹配問題。本發明實施方式能夠提高問題匹配的準確性和可靠性。此外,本發明的實施方式提供了一種問題匹配裝置。
技術領域
本發明的實施方式涉及自動問答技術領域,更具體地,本發明的實施方式涉及一種問題匹配方法和裝置。
背景技術
本部分旨在為權利要求書中陳述的本發明的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
FAQ(Frequently Asked Questions,常見問題)問答系統當中,預先根據常見問題,建立一個候選問題集,該候選問題集中的每個問題關聯相應的答案。當用戶提交問題后,在候選問題集中匹配與用戶提交的問題相似的問題,然后將匹配到的相似度較高的問題所關聯的答案推送給用戶,其中,常用的查找與用戶提交的問題相似的問題的方式為:
從用戶提交的問題中提取關鍵詞(或者關鍵詞同義詞),在候選問題集中的每個問題中匹配提取到的關鍵詞,如果在候選問題集的問題中匹配的到的關鍵詞越多,確定該問題與用戶提交的問題越相似,則該問題與用戶提交的問題的相似度越高。
但是,目前的這種匹配相似問題的方式,關鍵詞在不同的語境中可能會有不同的含義,并且僅根據單個問題與單個問題之間的相似度來匹配相似問題,此時,僅根據關鍵詞從候選問題集中匹配到的與用戶提交的問題相似度較高的問題可能是錯誤問題(與用戶提問的問題無關),因此,利用這種匹配相似問題的方式為用戶推送與用戶提交的問題相符的答案正確率較低。
發明內容
現有技術中的基于關鍵詞匹配相似問題的方式,由于關鍵詞在不同的語境中可能會有不同的含義,并且僅根據單個問題與單個問題之間的相似度來匹配相似問題,此時,僅根據關鍵詞從候選問題集中匹配到的與用戶提交的問題相似度較高的問題可能是錯誤問題(與用戶提問的問題無關),從而造成為用戶推送與用戶提交的問題相符的答案的正確率較低。為此,非常需要一種改進的問題匹配方法,來解決現有技術中存在的問題。
在本上下文中,本發明的實施方式期望提供一種問題匹配方法和裝置。
在本發明實施方式的第一方面中,提供了一種問題匹配方法,包括:
接收用戶提交的問題;
針對預設的每個問題集,計算該問題集與用戶提交的問題的相似度;
若所述相似度大于設定相似度閾值,確定該問題集中的待匹配問題與用戶提交的問題相匹配;
其中,同一問題集中保存至少兩個針對同一答案的待匹配問題。
在本發明實施方式的第二方面中,提供了一種問題匹配裝置,包括:
接收模塊,用于接收用戶提交的問題;
相似度計算模塊,用于針對預設的每個問題集,計算該問題集與用戶提交的問題的相似度;
確定模塊,用于若所述相似度大于設定相似度閾值,確定該問題集中的待匹配問題與用戶提交的問題相匹配;
其中,同一問題集中保存至少兩個針對同一答案的待匹配問題。
在本發明實施方式的第三方面中,提供了一種問題匹配設備,例如,可以包括存儲器和處理器,其中,處理器可以用于讀取存儲器中的程序,執行下列過程:
接收用戶提交的問題;
針對預設的每個問題集,計算該問題集與用戶提交的問題的相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州朗和科技有限公司,未經杭州朗和科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611192472.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種對海量文檔集的層次聚類方法及系統
- 下一篇:一種駕駛員評價方法及裝置





