[發(fā)明專利]人機(jī)交互方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201910829244.3 | 申請(qǐng)日: | 2019-09-03 |
| 公開(kāi)(公告)號(hào): | CN110634483B | 公開(kāi)(公告)日: | 2021-06-18 |
| 發(fā)明(設(shè)計(jì))人: | 李美卓;趙媛媛 | 申請(qǐng)(專利權(quán))人: | 北京達(dá)佳互聯(lián)信息技術(shù)有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/16;G10L25/87 |
| 代理公司: | 北京柏杉松知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 | 代理人: | 孫翠賢;丁蕓 |
| 地址: | 100085 北京市海淀*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人機(jī)交互 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種人機(jī)交互方法,其特征在于,應(yīng)用于社交互動(dòng)客戶端;所述方法包括:
當(dāng)檢測(cè)到語(yǔ)音時(shí),判斷所述語(yǔ)音中是否包含有喚醒詞;其中,所述喚醒詞為用于喚醒所述社交互動(dòng)客戶端中的虛擬形象的語(yǔ)音片段;
當(dāng)判斷出所述語(yǔ)音中包含所述喚醒詞時(shí),喚醒所述虛擬形象,并接收用戶給出的語(yǔ)音指令;
執(zhí)行所述語(yǔ)音指令所指示的目標(biāo)操作,并通過(guò)所述虛擬形象輸出反饋信息;其中,所述反饋信息為用于表征所述目標(biāo)操作的操作結(jié)果的信息;
所述接收用戶給出的語(yǔ)音指令的步驟,包括:開(kāi)啟拾音,并在拾音過(guò)程中,檢測(cè)是否出現(xiàn)語(yǔ)音尾端點(diǎn);當(dāng)檢測(cè)到所述語(yǔ)音尾端點(diǎn)時(shí),結(jié)束拾音,并將拾音期間的語(yǔ)音片段作為所接收的語(yǔ)音指令;所述檢測(cè)是否出現(xiàn)語(yǔ)音尾端點(diǎn)的步驟,包括:在拾音過(guò)程中,檢測(cè)是否出現(xiàn)大于預(yù)設(shè)時(shí)長(zhǎng)的靜音,如果是,檢測(cè)所述靜音之前拾音的語(yǔ)音對(duì)應(yīng)的語(yǔ)句是否完整;當(dāng)所述靜音之前拾音的語(yǔ)音對(duì)應(yīng)的語(yǔ)句完整時(shí),確定出現(xiàn)語(yǔ)音尾端點(diǎn);
所述判斷所述語(yǔ)音中是否包含有喚醒詞的步驟,包括:將所述語(yǔ)音輸入至預(yù)設(shè)的第二神經(jīng)網(wǎng)絡(luò)模型,得到由各個(gè)音素的排列組合所形成的多個(gè)音素序列,所述各個(gè)音素為所述語(yǔ)音對(duì)應(yīng)的音素序列中的各個(gè)音素;當(dāng)所述多個(gè)音素序列中,包含有與喚醒詞匹配的音素序列時(shí),判定所述語(yǔ)音中包含有所述喚醒詞;其中,所述第二神經(jīng)網(wǎng)絡(luò)模型為基于多個(gè)樣本語(yǔ)音以及每個(gè)樣本語(yǔ)音對(duì)應(yīng)的音素序列所訓(xùn)練獲得的。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測(cè)所述靜音之前拾音的語(yǔ)音對(duì)應(yīng)的語(yǔ)句是否完整的步驟,包括:
將所述靜音之前拾音的語(yǔ)音輸入至預(yù)設(shè)的第一神經(jīng)網(wǎng)絡(luò)模型,得到所述靜音之前拾音的語(yǔ)音對(duì)應(yīng)的語(yǔ)句是否完整的結(jié)果;
其中,所述第一神經(jīng)網(wǎng)絡(luò)模型,為基于多個(gè)樣本語(yǔ)音以及每個(gè)樣本語(yǔ)音的標(biāo)注信息所訓(xùn)練獲得的,所述標(biāo)注信息,用于表征樣本語(yǔ)音對(duì)應(yīng)的語(yǔ)句是否完整。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
當(dāng)檢測(cè)到滿足預(yù)定的推薦時(shí)機(jī)時(shí),通過(guò)所述虛擬形象輸出關(guān)于可執(zhí)行操作的推薦信息;
當(dāng)檢測(cè)到接受推薦的語(yǔ)音時(shí),執(zhí)行與所述推薦信息相匹配的可執(zhí)行操作。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述方法還包括:
當(dāng)檢測(cè)到滿足預(yù)定的互動(dòng)時(shí)機(jī)時(shí),播放為所述虛擬形象指定的、且與該互動(dòng)時(shí)機(jī)對(duì)應(yīng)的互動(dòng)語(yǔ)音,和/或,在為所述虛擬形象指定的短消息輸出區(qū)域中,輸出與該互動(dòng)時(shí)機(jī)對(duì)應(yīng)的互動(dòng)短消息。
5.一種人機(jī)交互裝置,其特征在于,應(yīng)用于社交互動(dòng)客戶端;所述裝置包括:
判斷模塊,被配置為當(dāng)檢測(cè)到語(yǔ)音時(shí),判斷所述語(yǔ)音中是否包含有喚醒詞;其中,所述喚醒詞為用于喚醒所述社交互動(dòng)客戶端中的虛擬形象的語(yǔ)音片段;
喚醒和接收模塊,被配置為當(dāng)所述判斷模塊判斷出所述語(yǔ)音中包含所述喚醒詞時(shí),喚醒所述虛擬形象,并接收用戶給出的語(yǔ)音指令;
執(zhí)行和輸出模塊,被配置為執(zhí)行所述語(yǔ)音指令所指示的目標(biāo)操作,并通過(guò)所述虛擬形象輸出反饋信息;其中,所述反饋信息為用于表征所述目標(biāo)操作的操作結(jié)果的信息;
所述喚醒和接收模塊接收用戶給出的語(yǔ)音指令,包括:開(kāi)啟拾音,并在拾音過(guò)程中,檢測(cè)是否出現(xiàn)語(yǔ)音尾端點(diǎn);當(dāng)檢測(cè)到所述語(yǔ)音尾端點(diǎn)時(shí),結(jié)束拾音,并將拾音期間的語(yǔ)音片段作為所接收的語(yǔ)音指令;所述喚醒和接收模塊檢測(cè)是否出現(xiàn)語(yǔ)音尾端點(diǎn),包括:在拾音過(guò)程中,檢測(cè)是否出現(xiàn)大于預(yù)設(shè)時(shí)長(zhǎng)的靜音,如果是,檢測(cè)所述靜音之前拾音的語(yǔ)音對(duì)應(yīng)的語(yǔ)句是否完整;當(dāng)所述靜音之前拾音的語(yǔ)音對(duì)應(yīng)的語(yǔ)句完整時(shí),確定出現(xiàn)語(yǔ)音尾端點(diǎn);
所述判斷模塊,具體被配置為:
將所述語(yǔ)音輸入至預(yù)設(shè)的第二神經(jīng)網(wǎng)絡(luò)模型,得到由各個(gè)音素的排列組合所形成的多個(gè)音素序列,所述各個(gè)音素為所述語(yǔ)音對(duì)應(yīng)的音素序列中的各個(gè)音素;
當(dāng)所述多個(gè)音素序列中,包含有與喚醒詞匹配的音素序列時(shí),判定所述語(yǔ)音中包含有所述喚醒詞;
其中,所述第二神經(jīng)網(wǎng)絡(luò)模型為基于多個(gè)樣本語(yǔ)音以及每個(gè)樣本語(yǔ)音對(duì)應(yīng)的音素序列所訓(xùn)練獲得的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京達(dá)佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達(dá)佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910829244.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于Web服務(wù)的分布式人機(jī)交互系統(tǒng)
- 用于提供人機(jī)交互資源的方法及設(shè)備
- 基于配置化實(shí)現(xiàn)人機(jī)交互功能的方法
- 一種人機(jī)交互平臺(tái)位置可調(diào)節(jié)的儲(chǔ)物柜
- 車載人機(jī)交互方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種網(wǎng)格化的飛行管理系統(tǒng)人機(jī)交互設(shè)計(jì)與實(shí)現(xiàn)方法
- 人機(jī)交互優(yōu)化方法以及相關(guān)裝置
- 消毒型自助設(shè)備及其控制方法
- 一種實(shí)時(shí)3D遠(yuǎn)程人機(jī)交互裝置
- 一種人機(jī)交互設(shè)備控制方法及裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





