[發(fā)明專利]一種機(jī)器人及提高其語音交互識別率的方法、裝置和電路有效
| 申請?zhí)枺?/td> | 201810514764.0 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN110534110B | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計(jì))人: | 熊友軍;李利陽;夏嚴(yán)輝;李浩明 | 申請(專利權(quán))人: | 深圳市優(yōu)必選科技有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/22;G10L19/16 |
| 代理公司: | 深圳中一聯(lián)合知識產(chǎn)權(quán)代理有限公司 44414 | 代理人: | 張全文 |
| 地址: | 518000 廣東省深圳市南山區(qū)*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機(jī)器人 提高 語音 交互 識別率 方法 裝置 電路 | ||
一種提高機(jī)器人語音交互識別率的電路包括第一解碼器、模數(shù)轉(zhuǎn)換器、麥克風(fēng)、主控制器,其中:所述主控制器檢測到機(jī)器人處于運(yùn)動狀態(tài)時(shí),向所述第一解碼器發(fā)送預(yù)先錄制的舵機(jī)聲文件;所述第一解碼器將所述舵機(jī)聲文件解碼得到舵機(jī)聲的第一聲音模擬信號;所述模數(shù)轉(zhuǎn)換器將所述第一解碼器發(fā)送的舵機(jī)聲的第一聲音模擬信號轉(zhuǎn)換為第一聲音數(shù)字信號,以及所述麥克風(fēng)采集的環(huán)境中第二聲音模擬信號轉(zhuǎn)換為第二聲音數(shù)字信號;所述主控制器還根據(jù)所述第一聲音數(shù)字信號和第二聲音數(shù)字信號,對獲取的第二聲音數(shù)字信號中的舵機(jī)聲進(jìn)行抑制處理。從而使得經(jīng)過抑制處理后的聲音能夠有效的減少機(jī)器舵機(jī)聲的影響,使得機(jī)器人語音交互時(shí)的識別率更高。
技術(shù)領(lǐng)域
本申請屬于機(jī)器人領(lǐng)域,尤其涉及一種機(jī)器人及提高其語音交互識別率的方法、裝置和電路。
背景技術(shù)
語音作為人類所特有的能力,是人類之間交流及獲取外界信息資源的重要的工具和渠道,對于人類文明的發(fā)展具有重要的意義。語音識別技術(shù)作為人機(jī)交互分支的重要組成,是人機(jī)交互的重要接口,對于人工智能的發(fā)展具有重要的實(shí)際意義。語音識別技術(shù)經(jīng)過數(shù)十年的發(fā)展,已經(jīng)取得了顯著的進(jìn)步,逐步開始從實(shí)驗(yàn)室慢慢走向市場。目前,針對特定說話人的語音識別系統(tǒng)已經(jīng)有較高的識別精度,并被廣泛應(yīng)用于工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)和消費(fèi)電子類產(chǎn)品等領(lǐng)域。
目前,現(xiàn)有的語音交互產(chǎn)品大多基于專用的語音識別芯片,將麥克風(fēng)輸入的聲音信號采樣編碼,再通過內(nèi)部主控制器與其事先錄制好的語音信息匹配,再將相應(yīng)的語音信息通過片內(nèi)的模塊經(jīng)過外置的揚(yáng)聲器輸出。
如果在機(jī)器人處于運(yùn)動狀態(tài),由于機(jī)器人自身的舵機(jī)會發(fā)出聲音,如果在機(jī)器人運(yùn)動時(shí)候采集到的語音,會包含有很強(qiáng)的舵機(jī)運(yùn)動產(chǎn)生的噪聲,影響用戶和機(jī)器人語音交互時(shí)的識別率。
發(fā)明內(nèi)容
有鑒于此,本申請實(shí)施例提供了一種提高機(jī)器人語音交互識別率的電路、方法和裝置,以解決現(xiàn)有技術(shù)中由于機(jī)器人自身的舵機(jī)會發(fā)出聲音,影響用戶和機(jī)器人語音交互時(shí)的識別率的問題。
本申請實(shí)施例的第一方面提供了一種提高機(jī)器人語音交互識別率的電路,所述電路包括第一解碼器、模數(shù)轉(zhuǎn)換器、麥克風(fēng)、主控制器,其中:
所述主控制器用于檢測到機(jī)器人處于運(yùn)動狀態(tài)時(shí),向所述第一解碼器發(fā)送預(yù)先錄制的舵機(jī)聲文件;
所述第一解碼器用于將所述舵機(jī)聲文件解碼得到舵機(jī)聲的第一聲音模擬信號;
所述模數(shù)轉(zhuǎn)換器用于將所述第一解碼器發(fā)送的舵機(jī)聲的第一聲音模擬信號轉(zhuǎn)換為第一聲音數(shù)字信號,以及所述麥克風(fēng)采集的環(huán)境中第二聲音模擬信號轉(zhuǎn)換為第二聲音數(shù)字信號;
所述主控制器還用于根據(jù)所述第一聲音數(shù)字信號和第二聲音數(shù)字信號,對獲取的第二聲音數(shù)字信號中的舵機(jī)聲進(jìn)行抑制處理。
結(jié)合第一方面,在第一方面的第一種可能實(shí)現(xiàn)方式中,所述電路還包括第二解碼器、揚(yáng)聲器,其中:
所述第二解碼器用于對主控制器發(fā)送的系統(tǒng)聲音進(jìn)行解碼得到系統(tǒng)聲音的第三聲音模擬信號,將所述第三聲音模擬信號發(fā)送至揚(yáng)聲器播放,以及將所述第三聲音模擬信號發(fā)送至所述模數(shù)轉(zhuǎn)換器;
所述主控制器還用于接收所述第三聲音模擬信號,對所述第二聲音模擬信號中的系統(tǒng)聲音進(jìn)行抑制處理。
結(jié)合第一方面的第一種可能實(shí)現(xiàn)方式,在第一方面的第二種可能實(shí)現(xiàn)方式中,所述電路還包括對第二解碼器輸出的聲音模擬信號進(jìn)行信號放大的放大器,所述放大器輸出第二聲音模擬信號,通過所述第二聲音模擬信號驅(qū)動揚(yáng)聲器。
本申請實(shí)施例的第二方面提供了一種提高機(jī)器人語音交互識別率的方法,所述方法包括:
當(dāng)檢測檢測到機(jī)器人處于運(yùn)動狀態(tài)時(shí),獲取預(yù)先錄制的舵機(jī)聲文件并解碼為第一聲音模擬信號,并轉(zhuǎn)換得到第一聲音數(shù)字信號;
將麥克風(fēng)采集的第二聲音模擬信號轉(zhuǎn)換為第二聲音數(shù)字信號;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市優(yōu)必選科技有限公司,未經(jīng)深圳市優(yōu)必選科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810514764.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





