[發明專利]基于字符串相似度算法的智能客服搜索方法與系統在審
| 申請號: | 201410171685.6 | 申請日: | 2014-04-25 |
| 公開(公告)號: | CN103914570A | 公開(公告)日: | 2014-07-09 |
| 發明(設計)人: | 陸贊信 | 申請(專利權)人: | 北京中訊愛樂科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州三環專利代理有限公司 44202 | 代理人: | 郝傳鑫 |
| 地址: | 100062 北京市東城區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 字符串 相似 算法 智能 客服 搜索 方法 系統 | ||
技術領域
本發明涉及信息檢索技術領域,尤其涉及一種基于字符串相似度算法的智能客服搜索方法。
背景技術
隨著經濟的發展,國內外正在往服務型社會轉變,要求社會的主體以人為本,具備更好地服務他人的理念,“智能客服”正是基于這個理念產生的。智能客服終端可以7天×24小時無間斷為用戶提供服務,既減少了資源的投入,也滿足了用戶隨時訪問的需求,提高了便捷性。譬如,目前,通過“微信”公眾平臺、SMS(Short?Message?Service,短信服務)等平臺,用戶可以隨時將數據請求發送到服務平臺的智能客服端口,服務平臺的智能客服終端則需要根據用戶請求的關鍵字,找到最匹配的信息(如問題答案)回復給用戶。例如,用戶在“微信”公眾平臺關注了某航空公司的公眾賬號后,發送信息“行程單”到該公眾平臺,智能客服終端可以檢測出該信息,并在其所在的數據庫中搜索出與該信息相關的行程內容,并進一步將這些內容推薦給用戶,以滿足用戶獲取某種特定數據的需要,智能地將用戶請求與數據庫數據進行匹配和推送。
目前的智能客服匹配大多是采用數據庫技術,即在數據庫中查找出用戶請求搜索的提問語完全一致的關鍵詞,或者將在提問語中出現的某個或某些關鍵詞進行匹配。但是,這種簡單的數據搜索方案無法做到“提問語與關鍵詞中有某一部分相同”時的數據搜索和匹配計算,并且其無法智能更新數據庫,因此難以做到真正的最優匹配?;诖?,現有技術中提出了一些大數據量的數據匹配或搜索方案,雖然這種改進方案能夠提高數據匹配搜索的準確度,但是這種數據量巨大的數據搜索方案無疑需要投入大量的時間和資源才能完成,因而其適用范圍受到了限制。
發明內容
本發明所要解決的技術問題是,提供一種基于字符串相似度算法的智能客服搜索方法,如何降低數據搜索的復雜度并提高數據匹配的準確度,從而提高智能客服的整體性能和拓寬其適用范圍。
為解決以上技術問題,一方面,本發明提供一種基于字符串相似度算法的智能客服搜索方法,
在知識庫或陌生詞庫對關鍵詞進行搜索,所述方法包括以下步驟:
S1:接收來自于客戶端的搜索請求,在所述知識庫中進行搜索;
S2:判斷所述知識庫中是否存在與所述搜索請求相匹配的關鍵詞,若存在,則將所述知識庫中相匹配的關鍵詞所對應的回復語反饋至所述客戶端;若不存在,則執行步驟S3,具體包括:
S21:將所述知識庫中的所有關鍵詞分割成多個數組;
S22:將每個數組中的所有關鍵詞與所述搜索請求的提問語進行逐一比較,采用字符串相似度算法逐一計算出所述提問語與每個所述數組中所有關鍵詞的相似度值;
S23:逐一比較所述相似度值與門限值的大小,記錄大于所述門限值的相似度值;在大于所述門限值的相似度值中查找每個所述數組中的最大相似度值,并記錄所述最大相似度值在所述知識庫中所對應的標識以及所述最大相似度值的個數;
S24:判斷所述最大相似度值是否存在最優值;若存在,則判定所述最優值的標識所對應的關鍵詞為與所述搜索請求相匹配的關鍵詞,且將所述相匹配的關鍵詞在所述知識庫中所對應的回復語判定為最優回復語并將其反饋至所述客戶端;若不存在,則執行步驟S3;
S3:對所述陌生詞庫進行搜索;判斷所述陌生詞庫中是否存在與所述搜索請求相匹配的關鍵詞,若存在,則將所述關鍵詞所對應的提問次數進行累計,并將默認回復語反饋至所述客戶端;若不存在,則在所述陌生詞庫中新增與所述搜索請求相匹配的關鍵詞,并將默認回復語反饋至所述客戶端。
優選地,所述步驟S24具體包括:
若當前最大相似度值的個數為零時,判定所述最大相似度值中不存在最優值,并執行所述步驟S3;
若當前最大相似度值的個數不為零時,判定所述最大相似度值存在最優值,且檢測所述知識庫中是否存儲有在先搜索的最優值;
若所述知識庫中存儲有在先搜索的最優值,則將所述在先搜索的最優值與當前最大相似度值進行比較,若不相等,則將所述在先搜索的最優值與所述當前最大相似度值中的較大值賦為當前搜索的最優值,并記錄所述最優值的標識;若相等,則將所述在先搜索的最優值的個數與當前最大相似度值的個數進行比較;
若所述在先搜索的最優值的個數大于當前最大相似度值的個數,則將所述在先搜索的最優值賦為當前搜索的最優值,并記錄所述最優值的標識;若所述在先搜索的最優值的個數小于當前最大相似度值的個數,則將所述當前最大相似度值賦為當前搜索的最優值,并記錄所述最優值的標識;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中訊愛樂科技有限公司,未經北京中訊愛樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410171685.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:乒乓球與拍的放置裝置
- 下一篇:一次性自毀式器官灌流接頭





