[發(fā)明專利]一種語音交互方法、裝置和智能終端有效

申請?zhí)枺?/td>	201780003279.0	申請日：	2017-12-27
公開（公告）號：	CN108369805B	公開（公告）日：	2019-08-13
發(fā)明（設(shè)計）人：	張含波	申請（專利權(quán)）人：	深圳前海達(dá)闥云端智能科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L13/033;G10L21/034
代理公司：	深圳市愛迪森知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44341	代理人：	何婷
地址：	518000 廣東省深圳市前海深港合作區(qū)前***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	應(yīng)答語音語音交互主頻率交互環(huán)境噪聲頻率噪聲信息噪聲音量智能終端合成指令播放音量動態(tài)調(diào)整掩蔽效應(yīng) 音量播放音量播放檢測
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明實(shí)施例提供了一種語音交互方法、裝置和智能終端。其中，所述方法包括：當(dāng)接收到語音交互指令時，檢測當(dāng)前交互環(huán)境的噪聲信息，所述噪聲信息包括噪聲音量和噪聲頻率；根據(jù)所述噪聲頻率確定用于合成與所述語音交互指令對應(yīng)的應(yīng)答語音的主頻率；基于所述主頻率合成所述應(yīng)答語音；根據(jù)所述噪聲音量、所述噪聲頻率和所述應(yīng)答語音的主頻率確定播放所述應(yīng)答語音的音量；以所確定的所述音量播放所述應(yīng)答語音。通過上述技術(shù)方案，本發(fā)明實(shí)施例能夠基于聲音的掩蔽效應(yīng)，根據(jù)當(dāng)前的交互環(huán)境的噪聲信息動態(tài)調(diào)整其應(yīng)答語音的主頻率和播放音量，使得用戶在任意交互環(huán)境下都可以獲得較好的語音交互體驗(yàn)。

技術(shù)領(lǐng)域

本發(fā)明涉及人工智能技術(shù)領(lǐng)域，尤其涉及一種語音交互方法、裝置和智能終端。

背景技術(shù)

隨著人工智能技術(shù)的不斷發(fā)展，智能機(jī)器人、智能家居、智能手機(jī)、智能家電、智能車載設(shè)備等智能終端受到了越來越多的用戶的青睞，人們的生活已經(jīng)逐漸走入人工智能時代。

其中，為了方便用戶的使用，很多智能終端都配置有語音交互功能，能夠向用戶作出語音響應(yīng)。一般地，智能終端可以在接收到語音交互指令時，根據(jù)該語音交互指令生成應(yīng)答文本，然后基于該應(yīng)答文本進(jìn)行文本語音轉(zhuǎn)換，即，TTS(Text to Speech)轉(zhuǎn)換，合成應(yīng)答語音，最后向用戶播放所合成的應(yīng)答語音。

在實(shí)現(xiàn)本發(fā)明的過程中，發(fā)明人發(fā)現(xiàn)：目前的智能終端在基于應(yīng)答文本進(jìn)行發(fā)聲的過程中，基本都是以預(yù)先設(shè)定好的頻率合成應(yīng)答語音，并以固定的音量播放所合成的應(yīng)答語音，沒有考慮交互環(huán)境的噪聲狀況，從而使得有時候用戶聽到智能終端的應(yīng)答語音的音量較小，無法聽清楚對話內(nèi)容；或者，有時候用戶聽到智能終端的應(yīng)答語音的音量較大，不符合當(dāng)時的氣氛，甚至有可能被嚇到。在進(jìn)行語音交互的過程中，用戶聽到智能終端的應(yīng)答語音的音量過大或者過小，均不利于用戶的友好體驗(yàn)。

因此，現(xiàn)有的語音交互技術(shù)還有待于改進(jìn)和發(fā)展。

發(fā)明內(nèi)容

本發(fā)明實(shí)施例提供一種語音交互方法、裝置和智能終端，能夠解決現(xiàn)有人機(jī)交互體驗(yàn)受交互環(huán)境的噪聲狀況的影響較大，不利于提升用戶體驗(yàn)的問題。

為解決上述技術(shù)問題，本發(fā)明實(shí)施例提供了以下幾種技術(shù)方案：

第一方面，本發(fā)明實(shí)施例提供了一種語音交互方法，應(yīng)用于智能終端，該方法包括：

當(dāng)接收到語音交互指令時，檢測當(dāng)前交互環(huán)境的噪聲信息，所述噪聲信息包括噪聲音量和噪聲頻率；

根據(jù)所述噪聲頻率確定用于合成與所述語音交互指令對應(yīng)的應(yīng)答語音的主頻率；

基于所述主頻率合成所述應(yīng)答語音；

根據(jù)所述噪聲音量、所述噪聲頻率和所述應(yīng)答語音的主頻率確定播放所述應(yīng)答語音的音量；

以所確定的所述音量播放所述應(yīng)答語音。

第二方面，本發(fā)明實(shí)施例提供一種語音交互裝置，運(yùn)行于智能終端，包括：

噪聲檢測單元，用于當(dāng)接收到語音交互指令時，檢測當(dāng)前交互環(huán)境的噪聲信息，所述噪聲信息包括噪聲音量和噪聲頻率；

主頻率確定單元，用于根據(jù)所述噪聲頻率確定用于合成與所述語音交互指令對應(yīng)的應(yīng)答語音的主頻率；

語音合成單元，用于基于所述主頻率合成所述應(yīng)答語音；

音量確定單元，用于根據(jù)所述噪聲音量、所述噪聲頻率和所述應(yīng)答語音的主頻率確定播放所述應(yīng)答語音的音量；

播放單元，用于以所確定的所述音量播放所述應(yīng)答語音。

第三方面，本發(fā)明實(shí)施例提供一種智能終端，包括：

至少一個處理器；以及，

與所述至少一個處理器通信連接的存儲器；其中，

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海達(dá)闥云端智能科技有限公司，未經(jīng)深圳前海達(dá)闥云端智能科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201780003279.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：語音交互設(shè)備和語音交互方法
下一篇：可配置的通用語言理解模型

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】