[發(fā)明專利]一種對話處理方法、設(shè)備及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201911190062.2 | 申請日: | 2019-11-28 |
| 公開(公告)號: | CN110910866B | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計)人: | 張瀚;林士翔;孫亭;婁曉丹;趙繼東 | 申請(專利權(quán))人: | 出門問問創(chuàng)新科技有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/16;G10L15/22;G10L15/26;G10L19/008;G10L25/51 |
| 代理公司: | 北京樂知新創(chuàng)知識產(chǎn)權(quán)代理事務所(普通合伙) 11734 | 代理人: | 江宇 |
| 地址: | 210033 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 對話 處理 方法 設(shè)備 計算機 可讀 存儲 介質(zhì) | ||
本發(fā)明實施例公開了一種對話處理方法、設(shè)備及計算機可讀存儲介質(zhì),所述方法包括:在執(zhí)行指定任務過程中,獲取聲音信號;對所述聲音信號進行處理,獲得對應所述聲音信號的拼接向量;通過邏輯回歸模型對所述拼接向量進行預測,獲得對應所述聲音信號的置信度;確定所述置信度是否滿足所述置信度閾值;當確定所述置信度滿足所述置信度閾值時,確定所述聲音信號為待執(zhí)行指令,應用本發(fā)明實施例能夠提高語音交互的便利性。
技術(shù)領(lǐng)域
本發(fā)明涉及語音處理技術(shù)領(lǐng)域,尤其涉及一種對話處理方法、設(shè)備及計算機可讀存儲介質(zhì)。
背景技術(shù)
智能語音交互是基于語音輸入的交互模式,通過說話就可以得到反饋結(jié)果。其原理是通過實時監(jiān)聽獲得外界的聲音信號,一旦監(jiān)聽到的聲音信號中包含喚醒詞時,設(shè)備就會被喚醒。喚醒的設(shè)備對外界的聲音信號進行采集,并將采集到的聲音信號進行數(shù)據(jù)處理,獲取并執(zhí)行對應聲音信號的指令。通過語音交互,用戶雖然能夠簡單方便地操作智能設(shè)備。但是,在用戶進行語音輸入的過程中,用戶容易出現(xiàn)說錯、改變想法等場景。在該情況下,用戶需要再次通過喚醒詞才能喚醒設(shè)備,增加了語音交互過程中的不便利性。
發(fā)明內(nèi)容
本發(fā)明實施例為了有效克服現(xiàn)有技術(shù)所存在的上述缺陷,創(chuàng)造性地提供一種對話處理方法、設(shè)備及計算機可讀存儲介質(zhì),提高了語音交互的便利性。
本發(fā)明一方面提供一種對話處理方法,所述方法包括:在執(zhí)行指定任務過程中,獲取聲音信號;對所述聲音信號進行處理,獲得對應所述聲音信號的拼接向量;通過邏輯回歸模型對所述拼接向量進行預測,獲得對應所述聲音信號的置信度;確定所述置信度是否滿足所述置信度閾值;當確定所述置信度滿足所述置信度閾值時,確定所述聲音信號為待執(zhí)行指令。
在一種可實施方式中,在確定所述聲音信號為待執(zhí)行指令之后,所述方法還包括:停止執(zhí)行所述指定任務;響應所述待執(zhí)行指令,以對用戶產(chǎn)生交互行為。
在一種可實施方式中,在確定置信度是否滿足置信度閾值之后,所述方法還包括:當確定所述置信度不滿足所述置信度閾值時,丟棄所述聲音信號。
在一種可實施方式中,對所述聲音信號進行處理,獲得對應所述聲音信號的拼接向量,包括:通過解碼器對所述聲音信號進行解碼,獲得對應所述聲音信號的解碼置信度;通過聲音分類器對所述聲音信號進行識別,獲得對應所述聲音信號的聲音置信度;獲得對應所述聲音信號的文本信號,通過文本分類器對所述文本信號進行轉(zhuǎn)換,獲得對應所述文本信號的文本置信度;對所述解碼置信度、聲音置信度和所述文本置信度進行拼接,獲得所述拼接向量。
在一種可實施方式中,所述邏輯回歸模型通過模型訓練獲得,用于模型訓練的訓練數(shù)據(jù)由上一輪聲音信號數(shù)據(jù)和當前聲音信號數(shù)據(jù)拼接而成。
本發(fā)明另一方面提供一種對話處理設(shè)備,所述設(shè)備包括:獲取模塊,用于在執(zhí)行指定任務過程中,獲取聲音信號;處理模塊,用于對所述聲音信號進行處理,獲得對應所述聲音信號的拼接向量;預測模塊,用于通過邏輯回歸模型對所述拼接向量進行預測,獲得對應所述聲音信號的置信度;第一確定模塊,用于確定所述置信度是否滿足所述置信度閾值;第二確定模塊,用于當確定所述置信度滿足所述置信度閾值時,確定所述聲音信號為待執(zhí)行指令。
在一種可實施方式中,所述設(shè)備還包括:停止模塊,用于停止執(zhí)行所述指定任務;響應模塊,用于響應所述待執(zhí)行指令,以對用戶產(chǎn)生交互行為。
在一種可實施方式中,所述第二確定模塊,還用于當確定所述置信度不滿足所述閾值時,丟棄所述聲音信號。
在一種可實施方式中,所述處理模塊,包括:解碼子模塊,用于通過解碼器對所述聲音信號進行解碼,獲得對應所述聲音信號的解碼置信度;識別子模塊,用于通過聲音分類器對所述聲音信號進行識別,獲得對應所述聲音信號的聲音置信度;轉(zhuǎn)換子模塊,用于獲得對應所述聲音信號的文本信號,通過文本分類器對所述文本信號進行轉(zhuǎn)換,獲得對應所述文本信號的文本置信度;拼接子模塊,用于對所述解碼置信度、聲音置信度和所述文本置信度進行拼接,獲得所述拼接向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于出門問問創(chuàng)新科技有限公司,未經(jīng)出門問問創(chuàng)新科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911190062.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





