[發(fā)明專利]人機(jī)交互方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010900822.0 | 申請日: | 2020-08-31 |
| 公開(公告)號: | CN112133307A | 公開(公告)日: | 2020-12-25 |
| 發(fā)明(設(shè)計)人: | 張剛;朱凱華;黃榮升 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L17/22;G06F3/16;G06F40/35 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11412 | 代理人: | 谷春靜 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人機(jī)交互 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種人機(jī)交互方法,包括:
當(dāng)檢測到用戶語音中的喚醒詞時,執(zhí)行喚醒操作;
根據(jù)所述用戶語音中的需求詞確定出用戶意圖,所述用戶語音中同時包括所述喚醒詞和所述需求詞;
獲取所述用戶語音為人機(jī)交互需求表達(dá)的聲學(xué)置信度;
若根據(jù)所述聲學(xué)置信度及所述用戶意圖確定出本次喚醒為一次真實的人機(jī)交互需求表達(dá),則對所述用戶語音進(jìn)行響應(yīng)。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述喚醒詞包括:由兩個字組成的喚醒詞。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述用戶語音中的需求詞確定出用戶意圖包括:對識別出的文本形式的需求詞進(jìn)行意圖理解,確定出所述用戶意圖。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取所述用戶語音為人機(jī)交互需求表達(dá)的聲學(xué)置信度包括:
獲取所述用戶語音的預(yù)定聲學(xué)特征;
將所述預(yù)定聲學(xué)特征輸入預(yù)先訓(xùn)練得到的評估模型,得到輸出的所述用戶語音為人機(jī)交互需求表達(dá)的聲學(xué)置信度。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述若根據(jù)所述聲學(xué)置信度及所述用戶意圖確定出本次喚醒為一次真實的人機(jī)交互需求表達(dá),則對所述用戶語音進(jìn)行響應(yīng)包括:
若確定所述聲學(xué)置信度大于預(yù)定閾值,且所述用戶意圖為與當(dāng)前場景相匹配的意圖,則確定本次喚醒為一次真實的人機(jī)交互需求表達(dá),并對所述用戶語音進(jìn)行響應(yīng)。
6.根據(jù)權(quán)利要求1所述的方法,還包括:若根據(jù)所述聲學(xué)置信度及所述用戶意圖確定出本次喚醒不是一次真實的人機(jī)交互需求表達(dá),則不對所述用戶語音進(jìn)行響應(yīng)。
7.一種人機(jī)交互裝置,包括:語音處理模塊以及語音響應(yīng)模塊;
所述語音處理模塊,用于當(dāng)檢測到用戶語音中的喚醒詞時,執(zhí)行喚醒操作,根據(jù)所述用戶語音中的需求詞確定出用戶意圖,所述用戶語音中同時包括所述喚醒詞和所述需求詞,獲取所述用戶語音為人機(jī)交互需求表達(dá)的聲學(xué)置信度;
所述語音響應(yīng)模塊,用于當(dāng)根據(jù)所述聲學(xué)置信度及所述用戶意圖確定出本次喚醒為一次真實的人機(jī)交互需求表達(dá)時,對所述用戶語音進(jìn)行響應(yīng)。
8.根據(jù)權(quán)利要求7所述的裝置,其中,所述喚醒詞包括:由兩個字組成的喚醒詞。
9.根據(jù)權(quán)利要求7所述的裝置,其中,所述語音處理模塊對識別出的文本形式的需求詞進(jìn)行意圖理解,確定出所述用戶意圖。
10.根據(jù)權(quán)利要求7所述的裝置,其中,所述語音處理模塊獲取所述用戶語音的預(yù)定聲學(xué)特征,將所述預(yù)定聲學(xué)特征輸入預(yù)先訓(xùn)練得到的評估模型,得到輸出的所述用戶語音為人機(jī)交互需求表達(dá)的聲學(xué)置信度。
11.根據(jù)權(quán)利要求7所述的裝置,其中,所述語音響應(yīng)模塊在確定所述聲學(xué)置信度大于預(yù)定閾值,且所述用戶意圖為與當(dāng)前場景相匹配的意圖時,確定本次喚醒為一次真實的人機(jī)交互需求表達(dá),對所述用戶語音進(jìn)行響應(yīng)。
12.根據(jù)權(quán)利要求7所述的裝置,其中,所述語音響應(yīng)模塊進(jìn)一步用于,若根據(jù)所述聲學(xué)置信度及所述用戶意圖確定出本次喚醒不是一次真實的人機(jī)交互需求表達(dá),則不對所述用戶語音進(jìn)行響應(yīng)。
13.一種電子設(shè)備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行權(quán)利要求1-6中任一項所述的方法。
14.一種存儲有計算機(jī)指令的非瞬時計算機(jī)可讀存儲介質(zhì),其中,所述計算機(jī)指令用于使所述計算機(jī)執(zhí)行權(quán)利要求1-6中任一項所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010900822.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于Web服務(wù)的分布式人機(jī)交互系統(tǒng)
- 用于提供人機(jī)交互資源的方法及設(shè)備
- 基于配置化實現(xiàn)人機(jī)交互功能的方法
- 一種人機(jī)交互平臺位置可調(diào)節(jié)的儲物柜
- 車載人機(jī)交互方法、系統(tǒng)及計算機(jī)可讀存儲介質(zhì)
- 一種網(wǎng)格化的飛行管理系統(tǒng)人機(jī)交互設(shè)計與實現(xiàn)方法
- 人機(jī)交互優(yōu)化方法以及相關(guān)裝置
- 消毒型自助設(shè)備及其控制方法
- 一種實時3D遠(yuǎn)程人機(jī)交互裝置
- 一種人機(jī)交互設(shè)備控制方法及裝置





