[發(fā)明專利]用于特定領(lǐng)域的人機對話理解方法與系統(tǒng)及相關(guān)設(shè)備有效
| 申請?zhí)枺?/td> | 201810092029.5 | 申請日: | 2018-01-30 |
| 公開(公告)號: | CN108334496B | 公開(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計)人: | 李長亮;孔存良;齊濟 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/332;G06N3/04;G06N3/08 |
| 代理公司: | 北京市恒有知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11576 | 代理人: | 郭文浩 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 特定 領(lǐng)域 人機對話 理解 方法 系統(tǒng) 相關(guān) 設(shè)備 | ||
本發(fā)明涉及人工智能領(lǐng)域,具體涉及一種用于特定領(lǐng)域的人機對話理解方法與系統(tǒng)及相關(guān)設(shè)備,目的在于提高對話理解的準(zhǔn)確率。本發(fā)明人機對話系統(tǒng)的對話理解方法,接收用戶當(dāng)前輸入詞并將該詞映射到向量空間;使用語義表示層,將歷史詞向量、語義標(biāo)注信息、意圖類別信息表示成向量;使用語義標(biāo)注層獲得當(dāng)前詞的語義標(biāo)簽;使用意圖識別層獲得當(dāng)前詞的意圖類別。在模型訓(xùn)練時,引入了額外的詞性信息,使用詞性預(yù)測層預(yù)測下一個輸入詞的詞性,通過對語義標(biāo)注、意圖識別、詞性預(yù)測三個任務(wù)進行聯(lián)合處理,充分利用三個任務(wù)間共享的語義信息,并使其互相提升;本發(fā)明邏輯清晰、效率高、準(zhǔn)確率高,妥善解決了現(xiàn)有人機對話系統(tǒng)無法有效進行實時對話理解的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,具體涉及一種用于特定領(lǐng)域的人機對話理解方法與系統(tǒng)及相關(guān)設(shè)備。
背景技術(shù)
對話理解是人機對話系統(tǒng)中的一項重要任務(wù),包括語義標(biāo)注和意圖識別兩個子任務(wù)。語義標(biāo)注指的是為用戶輸入語句中的每個詞分配一個語義標(biāo)簽,意圖識別指的是判斷每條用戶輸入語句的意圖。
人機對話系統(tǒng)中的用戶輸入語句多為口語,且比較簡短,具有句子形式多變,不統(tǒng)一的特點,使得語義標(biāo)注和意圖識別變得尤為困難。
現(xiàn)有的技術(shù)主要包括以下幾種:
(1)傳統(tǒng)的機器學(xué)習(xí)方法:該方法將語義標(biāo)注任務(wù)視作序列標(biāo)注問題,將意圖識別任務(wù)視作多分類問題,并且將這兩個問題分別進行處理。對于語義標(biāo)注任務(wù),該方法主要使用HMM(Hidden Markov Model,隱馬爾科夫模型)和CRF(Conditional Random Field,條件隨機場)進行處理;對于意圖識別任務(wù),主要使用支持向量機(SVM)進行處理。該方法的缺陷在于,模型的效果極大程度受到特征選擇的影響,且特征選擇的過程需要耗費大量的時間。并且,該方法忽略了語義信息,在復(fù)雜的對話理解任務(wù)中表現(xiàn)欠佳。
(2)基于深度學(xué)習(xí)的方法:該方法使用RNN(Recurrent Neural Networks,循環(huán)神經(jīng)網(wǎng)絡(luò))、CNN(Convolutional Neural Networks,卷積神經(jīng)網(wǎng)絡(luò))等深度模型,對用戶輸入進行建模,并分析其語義標(biāo)簽和意圖類別。該方法的優(yōu)點在于,不再受到特征選取的影響,并且可以利用淺層語義信息。但其缺陷在于,仍然將語義標(biāo)注和意圖識別兩個任務(wù)單獨處理,沒有充分利用兩個任務(wù)間共享的語義信息。
(3)基于聯(lián)合深度學(xué)習(xí)的方法:該方法使用RNN、CNN等深度模型,對語義標(biāo)注、意圖識別兩個任務(wù)進行聯(lián)合處理。處理過程中,利用了在兩個任務(wù)間共享的語義信息。但是,該方法仍然局限于使用用戶輸入的文本信息,導(dǎo)致兩個任務(wù)間共享的語義信息未被充分利用。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問題,本發(fā)明提出了一種用于特定領(lǐng)域的人機對話理解方法與系統(tǒng)及相關(guān)設(shè)備,提高了對話理解的正確率。
本發(fā)明的第一方面,提出一種用于特定領(lǐng)域的人機對話理解方法,包括以下步驟:
步驟S1,獲取用戶在當(dāng)前時刻輸入的一個詞,通過訓(xùn)練好的人機對話理解模型,計算該詞對應(yīng)的意圖類別;
步驟S2,判斷當(dāng)前語句是否結(jié)束,若是,則以最后時刻的意圖類別作為當(dāng)前語句的意圖類別;否則,轉(zhuǎn)至步驟S1;
其中,
所述人機對話理解模型,包括:詞向量層、語義表示層、語義標(biāo)注層和意圖識別層;
所述人機對話理解模型的訓(xùn)練方法為:
步驟A1,從訓(xùn)練數(shù)據(jù)集中讀取一條訓(xùn)練語句;
步驟A2,按先后順序從當(dāng)前的訓(xùn)練語句中讀取一個詞,通過所述人機對話理解模型,得到該詞對應(yīng)的語義表示、語義標(biāo)注信息和意圖類別;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810092029.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:短文本相似度計算方法及系統(tǒng)
- 下一篇:自動生成文本的方法和裝置
- 網(wǎng)絡(luò)的人機對話平臺
- 人機對話方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 任務(wù)型人機對話系統(tǒng)及其實現(xiàn)方法、裝置與電子設(shè)備
- 對話引導(dǎo)模型的訓(xùn)練樣本構(gòu)建方法和生成模型的方法
- 人機對話及人機對話模型獲取方法、裝置及存儲介質(zhì)
- 一種基于人機對話的智能問答方法和裝置以及設(shè)備
- 智能機器人的人機對話數(shù)據(jù)處理方法及系統(tǒng)
- 智能機器人的人機對話流程自動切換方法及系統(tǒng)
- 人機對話數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種英語人機對話系統(tǒng)及學(xué)習(xí)方法





