[發明專利]一種提供高頻問題回答的方法和裝置有效
| 申請號: | 201410049585.6 | 申請日: | 2014-02-12 |
| 公開(公告)號: | CN104834651B | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 陳超 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 劉光明;陸錦華 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提供 高頻 問題 回答 方法 裝置 | ||
本發明公開了一種提供高頻問題回答的方法和裝置,能夠提高處理高頻問題的系統的負載能力,并有助于快速響應高頻問題。本發明的提供高頻問題回答的方法包括:根據預選的高頻問題集,采用文本分類算法得出高頻問題的分類模型,其中答案相同的高頻問題歸為同一高頻問題類;使用所述分類模型,確定當前待回答的高頻問題可能屬于的一個或幾個高頻問題類;根據當前待回答的高頻問題對于確定的高頻問題類的屬于概率,對當前待回答的高頻問題進行答復。
技術領域
本發明涉及計算機網絡技術,特別地涉及一種提供高頻問題回答的方法和裝置。
背景技術
對于電子商務公司來說,回答客戶咨詢是日常運營中常見的工作。有些公司設有大量的客服人員,通過人工接聽電話或在線交流的方式來回答客戶的問題,這種方式耗費大量人力,成本較高。有些公司把問題及其答案呈現在網站的頁面中,讓用戶自行尋找答案。這種做法往往讓客戶感到厭煩,影響網站的訪問量,并且在問題數量較大的情況下,客戶難以快速找到問題及其答案。
為了方便客戶快速找到問題答案和緩解客服的接線壓力,這些公司都擁有或正在開發智能聊天系統,一方面解決客戶的咨詢問題,另一方面也可以解決一些不需要客服處理的具體業務。在實踐中,人們逐漸發現,在用戶咨詢的所有問題中,實際上只有很小的一部分問題是客戶經常咨詢的,這些問題被稱作高頻問題(Frequently Asked Questions,FAQ),通常占了客戶咨詢量的很大一部分。因此解決好這部分問題,對提高智能聊天系統的問答準確率和改善用戶體驗具有極大的促進作用。
在智能聊天系統中,處理高頻問題的大致做法是:由人工收集并整理得到高頻問題集,然后融合檢索、文本糾錯、語法分析、詞法分析、相似度匹配等多種技術,從而實現高頻問題的問答。圖1是根據現有技術的處理高頻問題的方案的示意圖。以下結合圖1對現有技術中處理高頻問題的方案做出說明。
在用戶輸入問題后,智能聊天系統中的預處理模塊對輸入問題進行預處理,其中主要是對輸入問題進行文本糾錯(把錯別字替換成正確的)、停用詞過濾(過濾掉一些無用的字詞,如:的、了、嗎等等)、詞法分析(對輸入問題進行分詞等操作)、語法分析(對輸入問題進行詞性標注等操作),上述處理的主要目的是為檢索模塊提供支撐,使檢索結果更加準確和高效。
對于預處理之后的高頻問題,由索引與檢索模塊從高頻問題索引庫中檢索與輸入問題相匹配的問題集,并對檢索到的問題集中的問題按相關度進行排序,傳給問題匹配模塊。問題匹配模塊進行關鍵詞或語義相似度計算,以確定檢索到的問題集與輸入問題的詞形或語義相似度,相當于二次排序,然后選取與輸入問題相似度最大的高頻問題,如果其閾值大于經驗閾值(經驗閾值通常是要用較長時間慢慢進行調整,并不能直接計算出來),則直接將答案向用戶輸出;否則,不直接進行回答,而把二次排序的前N個問題作為推薦問題返回給用戶,讓用戶自行進行選擇。
上述現有的高頻問題處理方案比較復雜耗時,需要服務器集群支撐,在處理量日益增大的情況下,容易出現用戶發送的問題得不到響應或響應較慢的情況。
發明內容
有鑒于此,本發明給出一種提供高頻問題回答的方法和裝置,能夠提高處理高頻問題的系統的負載能力,并有助于快速響應高頻問題。
為實現上述目的,根據本發明的一個方面,給出了一種提供高頻問題回答的方法。
本發明的提供高頻問題回答的方法包括:步驟A:根據預選的高頻問題集,采用文本分類算法得出高頻問題的分類模型,其中答案相同的高頻問題歸為同一高頻問題類;步驟B:使用所述分類模型,確定當前待回答的高頻問題可能屬于的一個或幾個高頻問題類;步驟C:根據當前待回答的高頻問題對于步驟B中確定的高頻問題類的屬于概率,對當前待回答的高頻問題進行答復。
可選地,所述步驟A包括:步驟A1:對所述高頻問題集進行特征化,使其中各個高頻問題在特征化之后為多個特征詞;步驟A2:對特征化之后的所述多個高頻問題進行模型訓練從而得到所述分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410049585.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種顯示網絡資源的質量參數的方法和裝置
- 下一篇:總線型的中央處理器





