[發(fā)明專利]人機對話上下文語義拒識方法在審
| 申請?zhí)枺?/td> | 202210975410.2 | 申請日: | 2022-08-15 |
| 公開(公告)號: | CN115329060A | 公開(公告)日: | 2022-11-11 |
| 發(fā)明(設(shè)計)人: | 孫云云;高美軍;周杰 | 申請(專利權(quán))人: | 四川長虹電器股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/30;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 成都虹橋?qū)@聞?wù)所(普通合伙) 51124 | 代理人: | 吳中偉 |
| 地址: | 621000 四*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人機對話 上下文 語義 方法 | ||
本發(fā)明涉及自然語言處理領(lǐng)域,為了提高拒識準(zhǔn)確率,提供了一種人機對話上下文語義拒識方法,包括:步驟1、建立強弱語義模型及上下文關(guān)系模型并訓(xùn)練,所述強弱語義模型用于判斷語句是否是針對機器作出的,所述上下文關(guān)系模型用于判斷當(dāng)前語句與前一輪語句是否有關(guān)聯(lián);步驟2、獲取用戶當(dāng)前語句,并將其輸入強弱語義模型進行判斷,若語句不是針對機器的,則將語句輸入上下文關(guān)系模型;步驟3、上下文關(guān)系模型判斷當(dāng)前語句與前一輪語句是否有關(guān)聯(lián):若不相關(guān),則當(dāng)前語句為拒識;若相關(guān)且前一輪語句為拒識,則當(dāng)前語句為拒識。采用上述步驟可以提高拒識準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理領(lǐng)域,具體是一種人機對話上下文語義拒識方法。
背景技術(shù)
人機交互已經(jīng)滲透到我們的生活,如我們可以通過語音控制身邊的電視,空調(diào)等。目前市面上運行在智能電視的語音助手普遍采用半雙工交互方式進行人機交互。其不足在于:一是使用喚醒詞,每次對話都需要使用喚醒詞,喚醒后才能進行交互;二是使用語音遙控器,當(dāng)用戶按下語音鍵,開啟對話進入拾音狀態(tài),當(dāng)用戶抬起語音鍵,停止拾音;三是在半雙工狀態(tài)下,環(huán)境噪聲以及周圍人聲容易引起無效輸入,對話系統(tǒng)或錯誤響應(yīng),或給出“沒聽懂”的呆板播報,并且播報時不能打斷,十分影響交互效率。
為了優(yōu)化體驗,引入了全雙工技術(shù)。當(dāng)用戶開啟全雙工模式時,由于周圍噪聲及語音技術(shù)局限,當(dāng)說話人的語音模糊不清、有周圍人說話聲、無意義語音或者語音數(shù)據(jù)不在已有訓(xùn)練集合中時,識別系統(tǒng)會產(chǎn)生識別錯誤,從而影響對話系統(tǒng)的識別和理解效果。為了解決這一問題,采用了語義拒識別方法。
現(xiàn)有的人機對話中的語義拒識別一般采用以下兩種方式:一是采用文本分類模型或文本相似度模型,獲取用戶問句和知識庫所有知識點的類別概率或相似度,從獲取的多個相似度中選取最大的類別概率或相似度,若最大類別概率或最大相似度未超過預(yù)設(shè)閾值,則拒絕識別用戶問句。二是在分類器新增“拒絕識別類”,如果用戶問句被分為拒絕識別類,則拒絕識別,否則,從知識庫獲取分類類別對應(yīng)知識點回答。第一種方式中的文本相似度模型方法,對特征工程具有較強的依賴性,容易造成拒識準(zhǔn)確率低。第二種方式,“拒絕識別類”的訓(xùn)練語料有限,因而拒絕識別范圍有限,面對真實世界中成千上萬的業(yè)務(wù)無關(guān)問句,造成拒識率太低。
發(fā)明內(nèi)容
為了提高拒識準(zhǔn)確率,提供了一種人機對話上下文語義拒識方法。
本發(fā)明解決上述問題所采用的技術(shù)方案是:
人機對話上下文語義拒識方法,包括:
步驟1、建立強弱語義模型及上下文關(guān)系模型并訓(xùn)練,所述強弱語義模型用于判斷語句是否是針對機器作出的,所述上下文關(guān)系模型用于判斷當(dāng)前語句與前一輪語句是否有關(guān)聯(lián);
步驟2、獲取用戶當(dāng)前語句,并將其輸入強弱語義模型進行判斷,若語句不是針對機器的,則將語句輸入上下文關(guān)系模型;
步驟3、上下文關(guān)系模型判斷當(dāng)前語句與前一輪語句是否有關(guān)聯(lián):若不相關(guān),則當(dāng)前語句為拒識;若相關(guān)且前一輪語句為拒識,則當(dāng)前語句為拒識。
進一步地,所述強弱語義模型包括:詞嵌入層、卷積層、池化層及輸出層。
進一步地,所述上下文關(guān)系模型包括:輸入層、Embedding層、LSTM層、Attention層及輸出層。
進一步地,所述步驟2具體為:
步驟21、獲取用戶當(dāng)前語句并使用bert模型將其轉(zhuǎn)換為向量;
步驟22、將步驟21得到的向量輸入強弱語義模型進行判斷,若語句不是針對機器的,則將語句輸入上下文關(guān)系模型。
進一步地,所述步驟1還包括建立關(guān)鍵詞庫,對應(yīng)的,所述步驟2中,若語句不是針對機器的,則將其輸入上下文關(guān)系模型前,還包括判斷語句中是否包含關(guān)鍵詞,若不包含,則將語句輸入上下文關(guān)系模型,若包含,則當(dāng)前語句不拒識。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川長虹電器股份有限公司,未經(jīng)四川長虹電器股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210975410.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)的人機對話平臺
- 人機對話方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 任務(wù)型人機對話系統(tǒng)及其實現(xiàn)方法、裝置與電子設(shè)備
- 對話引導(dǎo)模型的訓(xùn)練樣本構(gòu)建方法和生成模型的方法
- 人機對話及人機對話模型獲取方法、裝置及存儲介質(zhì)
- 一種基于人機對話的智能問答方法和裝置以及設(shè)備
- 智能機器人的人機對話數(shù)據(jù)處理方法及系統(tǒng)
- 智能機器人的人機對話流程自動切換方法及系統(tǒng)
- 人機對話數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種英語人機對話系統(tǒng)及學(xué)習(xí)方法





