[發(fā)明專利]一種機(jī)器人及提高其語音交互識別率的方法、裝置和電路有效

申請?zhí)枺?/td>	201810514764.0	申請日：	2018-05-25
公開（公告）號：	CN110534110B	公開（公告）日：	2022-04-15
發(fā)明（設(shè)計(jì)）人：	熊友軍;李利陽;夏嚴(yán)輝;李浩明	申請（專利權(quán)）人：	深圳市優(yōu)必選科技有限公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/22;G10L19/16
代理公司：	深圳中一聯(lián)合知識產(chǎn)權(quán)代理有限公司 44414	代理人：	張全文
地址：	518000 廣東省深圳市南山區(qū)***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種機(jī)器人提高語音交互識別率方法裝置電路
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

一種提高機(jī)器人語音交互識別率的電路包括第一解碼器、模數(shù)轉(zhuǎn)換器、麥克風(fēng)、主控制器，其中：所述主控制器檢測到機(jī)器人處于運(yùn)動狀態(tài)時(shí)，向所述第一解碼器發(fā)送預(yù)先錄制的舵機(jī)聲文件；所述第一解碼器將所述舵機(jī)聲文件解碼得到舵機(jī)聲的第一聲音模擬信號；所述模數(shù)轉(zhuǎn)換器將所述第一解碼器發(fā)送的舵機(jī)聲的第一聲音模擬信號轉(zhuǎn)換為第一聲音數(shù)字信號，以及所述麥克風(fēng)采集的環(huán)境中第二聲音模擬信號轉(zhuǎn)換為第二聲音數(shù)字信號；所述主控制器還根據(jù)所述第一聲音數(shù)字信號和第二聲音數(shù)字信號，對獲取的第二聲音數(shù)字信號中的舵機(jī)聲進(jìn)行抑制處理。從而使得經(jīng)過抑制處理后的聲音能夠有效的減少機(jī)器舵機(jī)聲的影響，使得機(jī)器人語音交互時(shí)的識別率更高。

技術(shù)領(lǐng)域

本申請屬于機(jī)器人領(lǐng)域，尤其涉及一種機(jī)器人及提高其語音交互識別率的方法、裝置和電路。

背景技術(shù)

語音作為人類所特有的能力，是人類之間交流及獲取外界信息資源的重要的工具和渠道，對于人類文明的發(fā)展具有重要的意義。語音識別技術(shù)作為人機(jī)交互分支的重要組成，是人機(jī)交互的重要接口，對于人工智能的發(fā)展具有重要的實(shí)際意義。語音識別技術(shù)經(jīng)過數(shù)十年的發(fā)展，已經(jīng)取得了顯著的進(jìn)步，逐步開始從實(shí)驗(yàn)室慢慢走向市場。目前，針對特定說話人的語音識別系統(tǒng)已經(jīng)有較高的識別精度，并被廣泛應(yīng)用于工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)和消費(fèi)電子類產(chǎn)品等領(lǐng)域。

目前，現(xiàn)有的語音交互產(chǎn)品大多基于專用的語音識別芯片，將麥克風(fēng)輸入的聲音信號采樣編碼，再通過內(nèi)部主控制器與其事先錄制好的語音信息匹配，再將相應(yīng)的語音信息通過片內(nèi)的模塊經(jīng)過外置的揚(yáng)聲器輸出。

如果在機(jī)器人處于運(yùn)動狀態(tài)，由于機(jī)器人自身的舵機(jī)會發(fā)出聲音，如果在機(jī)器人運(yùn)動時(shí)候采集到的語音，會包含有很強(qiáng)的舵機(jī)運(yùn)動產(chǎn)生的噪聲，影響用戶和機(jī)器人語音交互時(shí)的識別率。

發(fā)明內(nèi)容

有鑒于此，本申請實(shí)施例提供了一種提高機(jī)器人語音交互識別率的電路、方法和裝置，以解決現(xiàn)有技術(shù)中由于機(jī)器人自身的舵機(jī)會發(fā)出聲音，影響用戶和機(jī)器人語音交互時(shí)的識別率的問題。

本申請實(shí)施例的第一方面提供了一種提高機(jī)器人語音交互識別率的電路，所述電路包括第一解碼器、模數(shù)轉(zhuǎn)換器、麥克風(fēng)、主控制器，其中：

所述主控制器用于檢測到機(jī)器人處于運(yùn)動狀態(tài)時(shí)，向所述第一解碼器發(fā)送預(yù)先錄制的舵機(jī)聲文件；

所述第一解碼器用于將所述舵機(jī)聲文件解碼得到舵機(jī)聲的第一聲音模擬信號；

所述模數(shù)轉(zhuǎn)換器用于將所述第一解碼器發(fā)送的舵機(jī)聲的第一聲音模擬信號轉(zhuǎn)換為第一聲音數(shù)字信號，以及所述麥克風(fēng)采集的環(huán)境中第二聲音模擬信號轉(zhuǎn)換為第二聲音數(shù)字信號；

所述主控制器還用于根據(jù)所述第一聲音數(shù)字信號和第二聲音數(shù)字信號，對獲取的第二聲音數(shù)字信號中的舵機(jī)聲進(jìn)行抑制處理。

結(jié)合第一方面，在第一方面的第一種可能實(shí)現(xiàn)方式中，所述電路還包括第二解碼器、揚(yáng)聲器，其中：

所述第二解碼器用于對主控制器發(fā)送的系統(tǒng)聲音進(jìn)行解碼得到系統(tǒng)聲音的第三聲音模擬信號，將所述第三聲音模擬信號發(fā)送至揚(yáng)聲器播放，以及將所述第三聲音模擬信號發(fā)送至所述模數(shù)轉(zhuǎn)換器；

所述主控制器還用于接收所述第三聲音模擬信號，對所述第二聲音模擬信號中的系統(tǒng)聲音進(jìn)行抑制處理。

結(jié)合第一方面的第一種可能實(shí)現(xiàn)方式，在第一方面的第二種可能實(shí)現(xiàn)方式中，所述電路還包括對第二解碼器輸出的聲音模擬信號進(jìn)行信號放大的放大器，所述放大器輸出第二聲音模擬信號，通過所述第二聲音模擬信號驅(qū)動揚(yáng)聲器。

本申請實(shí)施例的第二方面提供了一種提高機(jī)器人語音交互識別率的方法，所述方法包括：

當(dāng)檢測檢測到機(jī)器人處于運(yùn)動狀態(tài)時(shí)，獲取預(yù)先錄制的舵機(jī)聲文件并解碼為第一聲音模擬信號，并轉(zhuǎn)換得到第一聲音數(shù)字信號；

將麥克風(fēng)采集的第二聲音模擬信號轉(zhuǎn)換為第二聲音數(shù)字信號；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市優(yōu)必選科技有限公司，未經(jīng)深圳市優(yōu)必選科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810514764.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：語音識別方法、裝置、電子設(shè)備及存儲介質(zhì)
下一篇：下單實(shí)現(xiàn)方法、裝置及移動終端

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】