[發明專利]人機交互方法、裝置、電子設備及存儲介質有效
| 申請號: | 201910829244.3 | 申請日: | 2019-09-03 |
| 公開(公告)號: | CN110634483B | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 李美卓;趙媛媛 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/16;G10L25/87 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 孫翠賢;丁蕓 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人機交互 方法 裝置 電子設備 存儲 介質 | ||
本公開關于一種人機交互方法、裝置、電子設備及存儲介質。該方法包括:當檢測到語音時,判斷所述語音中是否包含有喚醒詞;其中,所述喚醒詞為用于喚醒所述社交互動客戶端中的虛擬形象的語音片段;當判斷出所述語音中包含所述喚醒詞時,喚醒所述虛擬形象,并接收用戶給出的語音指令;執行所述語音指令所指示的目標操作,并通過所述虛擬形象輸出反饋信息;其中,所述反饋信息為用于表征所述目標操作的操作結果的信息。本公開可以提高在社交互動客戶端中的人機交互的趣味性。
技術領域
本公開涉及互聯網技術領域,尤其涉及人機交互方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網技術的發展,誕生了很多社交互動客戶端,如視頻社交互動客戶端、即時通訊客戶端以及音頻分享客戶端等。這里,社交互動客戶端與常規的工具型客戶端相比,前者對人機交互過程的趣味性具有較高的要求。
相關技術中,針對社交互動客戶端的人機交互方法包括:接收用戶基于客戶端頁面手動發出的操作指令,執行與操作指令對應的操作。其中,操作指令包括檢索指令、功能開啟指令、音視頻播放指令等指令。
然而,相關技術所提供的交互過程為傳統的人機交互過程,趣味性不足。而由于趣味性是影響用戶對社交互動客戶端的使用粘性的重要因素,因此,亟需一種人機交互方法,以提高在社交互動客戶端中的人機交互的趣味性。
發明內容
本公開提供一種人機交互方法、裝置、電子設備及存儲介質,以提高在社交互動客戶端中的人機交互的趣味性。本公開的技術方案如下:
根據本公開實施例的第一方面,提供一種人機交互方法,該方法應用于社交互動客戶端,包括:
當檢測到語音時,判斷所述語音中是否包含有喚醒詞;其中,所述喚醒詞為用于喚醒所述社交互動客戶端中的虛擬形象的語音片段;
當判斷出所述語音中包含所述喚醒詞時,喚醒所述虛擬形象,并接收用戶給出的語音指令;
執行所述語音指令所指示的目標操作,并通過所述虛擬形象輸出反饋信息;其中,所述反饋信息為用于表征所述目標操作的操作結果的信息。
可選地,所述接收用戶給出的語音指令的步驟,包括:
開啟拾音,并在拾音過程中,檢測是否出現語音尾端點;
當檢測到所述語音尾端點時,結束拾音,并將拾音期間的語音片段作為所接收的語音指令。
可選地,所述檢測是否出現語音尾端點的步驟,包括:
在拾音過程中,檢測是否出現大于預設時長的靜音,如果是,檢測所述靜音之前拾音的語音對應的語句是否完整;
當所述靜音之前拾音的語音對應的語句完整時,確定出現語音尾端點。
可選地,所述檢測所述靜音之前拾音的語音對應的語句是否完整的步驟,包括:
將所述靜音之前拾音的語音輸入至預設的第一神經網絡模型,得到所述靜音之前拾音的語音對應的語句是否完整的結果;
其中,所述第一神經網絡模型,為基于多個樣本語音以及每個樣本語音的標注信息所訓練獲得的,所述標注信息,用于表征樣本語音對應的語句是否完整。
可選地,所述判斷所述語音中是否包含有喚醒詞的步驟,包括:
將所述語音輸入至預設的第二神經網絡模型,得到由各個音素的排列組合所形成的多個音素序列,所述各個音素為所述語音對應的音素序列中的各個音素;
當所述多個音素序列中,包含有與喚醒詞匹配的音素序列時,判定所述語音中包含有所述喚醒詞;
其中,所述第二神經網絡模型為基于多個樣本語音以及每個樣本語音對應的音素序列所訓練獲得的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910829244.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能控制系統及智能插座
- 下一篇:一種可適應低壓驅動的語音智能控制模塊





