[發(fā)明專利]一種智能客服語義處理方法有效
| 申請?zhí)枺?/td> | 202010284743.1 | 申請日: | 2020-04-13 |
| 公開(公告)號: | CN111523328B | 公開(公告)日: | 2023-09-05 |
| 發(fā)明(設(shè)計)人: | 費(fèi)春勇;黃峰;余敏;王定軍;張繼康 | 申請(專利權(quán))人: | 中博信息技術(shù)研究院有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/216;G06F40/289;G06F40/242;G06N3/02;G06F16/332;G06Q30/015 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231 | 代理人: | 李珍 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 智能 客服 語義 處理 方法 | ||
本發(fā)明公開了一種智能客服語義處理方法,屬于人工智能自然語言里技術(shù)領(lǐng)域,建立客服客戶端、樣本數(shù)據(jù)采樣模塊和云服務(wù)器,在云服務(wù)器中建立DSSM語義相似度模型模塊和TF?IDF模型模塊,基于樣本數(shù)據(jù)訓(xùn)練DSSM語義相似度模型,基于海量數(shù)據(jù)訓(xùn)練TF?IDF模型,構(gòu)建TF?IDF模型語義相似度計算方法,采用語義相似度的排序算法能夠很好的平衡準(zhǔn)確度與效率,采用人工客服的日常運(yùn)維提供大量的對話知識庫,以深度學(xué)習(xí)技術(shù)為算法核心的語義理解方法,為辦公領(lǐng)域智能客服提供了快速準(zhǔn)確的語義匹配,提高了辦公效率。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能自然語言處理技術(shù)領(lǐng)域,涉及一種智能客服語義處理方法。
背景技術(shù)
近年來,智能客服已經(jīng)成功運(yùn)用于各行各業(yè)咨詢服務(wù)業(yè)務(wù)中,為企業(yè)以及用戶提供了快捷方便的解決路徑,同樣類似于中國電信等大型企業(yè)在辦公管理過程中也會遇到各種咨詢問題,而僅僅通過詢問人工客服不僅效率低下,而且要求人工客服詳細(xì)了解辦公系統(tǒng)中各個部門的精細(xì)工作。通過將日常辦公領(lǐng)域涉及到的散而細(xì)的業(yè)務(wù)問題整理成問答對形式的知識庫,通過對咨詢問題的語義理解,來匹配出語義最相似答案,這種方式的智能客服不僅降低了工作量,將人工客服員從大量重復(fù)、機(jī)械的工作中解放出來,著重用于解決辦公中一些復(fù)雜的問題上,有效進(jìn)行資源分配,降低成本;而且時刻在線,提高辦公效率。
傳統(tǒng)的智能客服的語義理解方法主要是以自定義模板匹配以及關(guān)鍵字匹配來解析用戶問題,缺點在于模板問法相對單一,限制用戶問題必須包含在模板中或者是帶有相同的關(guān)鍵詞,遇到相似表達(dá)語義的問法就難以被匹配到。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種智能客服語義處理方法,解決了傳統(tǒng)技術(shù)的不足的技術(shù)問題。
為實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
一種智能客服語義處理方法,包括如下步驟:
步驟1:建立客服客戶端、樣本數(shù)據(jù)采樣模塊和云服務(wù)器,客服客戶端、樣本數(shù)據(jù)采樣數(shù)據(jù)庫和云服務(wù)器之間通過互聯(lián)網(wǎng)相互通信;
在云服務(wù)器中建立DSSM語義相似度模型模塊和TF-IDF模型模塊;
在樣本數(shù)據(jù)采樣模塊中建立領(lǐng)域外開源樣本數(shù)據(jù)庫和領(lǐng)域內(nèi)樣本數(shù)據(jù)庫;
步驟2:在DSSM語義相似度模型模塊中建立DSSM語義相似度模型;
DSSM語義相似度模型模塊調(diào)取領(lǐng)域外開源樣本數(shù)據(jù)庫中的數(shù)據(jù)對DSSM語義相似度模型進(jìn)行訓(xùn)練;
步驟3:對領(lǐng)域內(nèi)樣本數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行標(biāo)注處理,其標(biāo)注方法采用問題+答案的方式;
步驟4:在樣本數(shù)據(jù)采樣模塊中添加開放領(lǐng)域知識豐富訓(xùn)練數(shù)據(jù)庫;
步驟5:根據(jù)開放領(lǐng)域知識豐富訓(xùn)練數(shù)據(jù)庫中的數(shù)據(jù),建立領(lǐng)域?qū)S米值洌?/p>
步驟6:基于word2vec將專用字典中的所有字均生成對應(yīng)的字向量T;
步驟7:根據(jù)以下方法以DSSM為算法核心,選定Transformer特征提取網(wǎng)絡(luò),對標(biāo)注好的數(shù)據(jù)進(jìn)行訓(xùn)練,得到DSSM語義相似度模型:
步驟S1:以Transformer-DSSM深度網(wǎng)絡(luò)為主要框架,輸入字向量T經(jīng)過雙向GRU提取特征后輸出256維向量;
步驟S2:將步驟S1的結(jié)果再輸入到Transformer層,經(jīng)提取特征后輸出512維向量F=((t11,t12,t13,...t1,512),...(tc1,tc2,tc3,...,tc,512));其中,c代表知識庫文本的數(shù)量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中博信息技術(shù)研究院有限公司,未經(jīng)中博信息技術(shù)研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010284743.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





