[發明專利]智能問答方法及系統在審
| 申請號: | 201610125795.8 | 申請日: | 2016-03-04 |
| 公開(公告)號: | CN107153639A | 公開(公告)日: | 2017-09-12 |
| 發明(設計)人: | 盧菁;馬佳樂;葉茂;湯幟;黃肖俊;徐劍波 | 申請(專利權)人: | 北大方正集團有限公司;北京方正阿帕比技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 北京路浩知識產權代理有限公司11002 | 代理人: | 李相雨 |
| 地址: | 100871 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 問答 方法 系統 | ||
1.一種智能問答方法,其特征在于,包括:
從用戶終端獲取用戶輸入的問題并使用分詞器對其分詞;
將分詞后的用戶輸入的問題與問答庫中的每個問題依次比較,以獲取所述問答庫中的每個問題的相似度;所述問答庫通過選取預設數量的由一一對應的問題與答案構成的問答對構建;
對所述問答庫中的每個問題的相似度進行排序,將相似度排序靠前的N個問答對傳輸至所述用戶終端,N為正整數。
2.根據權利要求1所述的智能問答方法,其特征在于,所述相似度是通過對詞義相似度、語序相似度和句子長度維數加權求和所得到的數值。
3.根據權利要求1或2所述的智能問答方法,其特征在于,所述將分詞后的用戶輸入的問題與問答庫中的每個問題依次比較,以獲取所述問答庫中的每個問題的相似度的步驟包括:
根據所述分詞在所述問答庫中檢索候選問題,并對所述候選問題進行排序;
從排序后的候選問題中取前M個問答對與所輸入的問題進行相似度計算,M>N。
4.根據權利要求3所述的智能問答方法,其特征在于,使用分詞器對所述輸入的問題進行分詞的步驟之后,所述方法還包括:
將所述輸入的問題的分詞與停用表進行匹配,去除上述分詞中的停用詞。
5.根據權利要求3所述的智能問答方法,其特征在于,采用TF-IDF算法檢索候選問答對并對候選問答對進行排序。
6.根據權利要求3所述的智能問答方法,其特征在于,所述從排序后的候選問題中取前M個問答對與所輸入的問題進行相似度計算的步驟包括:
從輸入的問題與問答庫中每個問題選擇連續出現的至少兩個分詞;
計算所述至少兩個分詞的內聚程度;所述內聚程度InnerLevel通過以下公式計算:
式中,P(A)表示分詞A出現的概率;P(B)表示分詞B出現的概率;P(AB)表示分詞A與分詞B同時出現的概率;
將內聚程度超過預設內聚程度值的分詞進行合并。
7.根據權利要求6所述的智能問答方法,其特征在于,所述將內聚程度超過預設內聚程度值的分詞進行合并的步驟之后,所述方法還包括:
采用TF-IDF算法對M個問答對進行排序,并且每個分詞的得分作為詞語相似度權重。
8.根據權利要求1所述的智能問答方法,其特征在于,所述方法還包括:
當從所述問題庫中找到的候選問答對為N1個時,N1<N,采用拒絕算法對該N1個問答對進行剔除;
所述拒絕算法為:
除去形容詞與副詞后,若第一候選問答對中不包含詞語動態權重排序靠前的前N2個分詞及其擴展詞時,拒絕該問答對;
或者,
計算該N1個候選問答對中前面一個與后面一個候選問答對的得分差值百分比;
當該得分差值百分比小于預設得分差值百分比時,則拒絕后面一個候選問答對以其之后的所有問答對。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京方正阿帕比技術有限公司,未經北大方正集團有限公司;北京方正阿帕比技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610125795.8/1.html,轉載請聲明來源鉆瓜專利網。





