[發(fā)明專利]一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202310418807.6 | 申請(qǐng)日: | 2023-04-13 |
| 公開(公告)號(hào): | CN116600052A | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計(jì))人: | 丁常坤;夏兵;程磊;汪睿卿 | 申請(qǐng)(專利權(quán))人: | 科大國創(chuàng)軟件股份有限公司 |
| 主分類號(hào): | H04M3/51 | 分類號(hào): | H04M3/51;G10L15/16;G10L15/26;G06F40/35;G06N3/0455;G06N3/047;G06N3/08;G06F16/332;G06F16/33 |
| 代理公司: | 合肥昊晟德專利代理事務(wù)所(普通合伙) 34153 | 代理人: | 何梓秋 |
| 地址: | 230088 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 知識(shí) 計(jì)算 智能 客服 助理 意圖 識(shí)別 方法 系統(tǒng) | ||
1.一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法,其特征在于,包括以下步驟:
S1:模型運(yùn)營及管理規(guī)則配置
將意圖識(shí)別任務(wù)抽象為文本匹配任務(wù),構(gòu)建基于孿生網(wǎng)絡(luò)的sentence-Transformer雙塔模型;基于實(shí)際業(yè)務(wù)需求,配置模型運(yùn)行規(guī)則,創(chuàng)建模型訓(xùn)練任務(wù)進(jìn)行模型訓(xùn)練,模型性能滿足預(yù)設(shè)性能指標(biāo)則上線運(yùn)營;配置模型管理規(guī)則,進(jìn)行模型迭代優(yōu)化;
S2:客戶意圖識(shí)別
獲取用戶通話語音,將通話語音轉(zhuǎn)成文本,根據(jù)基于具體業(yè)務(wù)內(nèi)容和先驗(yàn)知識(shí)配置詞庫管理規(guī)則,建立對(duì)應(yīng)業(yè)務(wù)場景的行業(yè)詞庫,定義相關(guān)詞表對(duì)文本進(jìn)行預(yù)處理,隨后輸入經(jīng)過訓(xùn)練及迭代優(yōu)化的模型獲得意圖識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法,其特征在于:在所述步驟S1中,所述sentence-Transformer雙塔模型的處理過程如下:
S101:將兩個(gè)輸入分別輸入到ERINE預(yù)訓(xùn)練模型,共享同一個(gè)ERINE參數(shù),ERINE預(yù)訓(xùn)練模型采用多層Transformer作為編碼器,通過注意力機(jī)制捕獲每個(gè)詞向量在文本序列的上下文信息,獲得兩個(gè)符合語義表示特性的固定維度初始文本嵌入向量;
S102:采用均值池化層對(duì)ERINE預(yù)訓(xùn)練模型生成的嵌入向量進(jìn)行特征提取,轉(zhuǎn)化為兩個(gè)特征向量u、v;
S103:拼接u、v,|u-v|三個(gè)特征向量,使用Softmax函數(shù)進(jìn)行分類輸出,獲得意圖識(shí)別結(jié)果。
3.根據(jù)權(quán)利要求2所述的一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法,其特征在于:在所述步驟S103中,意圖識(shí)別結(jié)果表達(dá)式如下:
o=softmax[wt(u,v,|u-v|)]。
4.根據(jù)權(quán)利要求1所述的一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法,其特征在于:在所述步驟S1中,模型訓(xùn)練任務(wù)包括訓(xùn)練超參數(shù)和性能度量設(shè)計(jì),其中,超參數(shù)包括學(xué)習(xí)率、訓(xùn)練輪次和數(shù)據(jù)集劃分比例;性能度量包括精確率、召回率和精確率,具體表達(dá)式如下:
其中,TP表示某一意圖類中正確預(yù)測的文本數(shù)量;FP表示某一意圖類中錯(cuò)誤將他類預(yù)測為當(dāng)前類的文本數(shù)量;FN表示某一意圖類中錯(cuò)誤將當(dāng)前類預(yù)測為他類的文本數(shù)量;TN表示某一意圖類中正確識(shí)別的非當(dāng)前類文本數(shù)量;TP、FP、FN和TN的和為文本總數(shù)。
5.根據(jù)權(quán)利要求2所述的一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法,其特征在于:在所述步驟S1中,模型訓(xùn)練的具體過程如下:
S201:導(dǎo)入已打標(biāo)的歷史工單制作標(biāo)準(zhǔn)文本數(shù)據(jù)集,劃分訓(xùn)練集和測試集,依據(jù)設(shè)定的訓(xùn)練超參數(shù)開始模型訓(xùn)練;
S202:在測試集上對(duì)訓(xùn)練后生成的模型進(jìn)行性能度量,如滿足預(yù)設(shè)性能指標(biāo)則上線運(yùn)營,如未滿足預(yù)設(shè)性能指標(biāo)則重新訓(xùn)練模型,直至滿足預(yù)設(shè)性能指標(biāo)。
6.根據(jù)權(quán)利要求1所述的一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法,其特征在于:在所述步驟S1中,配置模型管理規(guī)則包括自學(xué)習(xí)任務(wù)配置和模型版本管理配置,其中,自學(xué)習(xí)任務(wù)基于實(shí)際業(yè)務(wù)需求和變化定義了訓(xùn)練超參數(shù)和模型迭代優(yōu)化的觸發(fā)條件,模型版本管理對(duì)運(yùn)營中生成的各代模型改進(jìn)及其優(yōu)化過程進(jìn)行跟蹤、記錄和維護(hù)。
7.根據(jù)權(quán)利要求1所述的一種基于知識(shí)計(jì)算的智能客服助理意圖識(shí)別方法,其特征在于:在所述步驟S2中,具體處理過程如下:
S21:對(duì)接語音轉(zhuǎn)寫平臺(tái),獲取用戶通話語音的文本;
S22:基于具體業(yè)務(wù)內(nèi)容和先驗(yàn)知識(shí)配置詞庫管理規(guī)則,建立對(duì)應(yīng)業(yè)務(wù)場景的行業(yè)詞庫,定義專有詞、同義詞和停用詞詞表;
S23:參考已建立的行業(yè)詞庫中的專有詞和同義詞表對(duì)文本進(jìn)行分詞處理,將原始文本分割成詞粒度的表示形式;然后參考已建立的行業(yè)詞庫中的停用詞表去除文本中對(duì)意圖識(shí)別無意義的停用詞;
S24:經(jīng)過預(yù)處理后得到的數(shù)據(jù)形式為去除停用詞且保留專有詞的詞粒度表示形式,將預(yù)處理后得到的數(shù)據(jù)輸入經(jīng)過訓(xùn)練及迭代優(yōu)化的模型獲得意圖識(shí)別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大國創(chuàng)軟件股份有限公司,未經(jīng)科大國創(chuàng)軟件股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310418807.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





