[發(fā)明專利]能實(shí)時(shí)分辨環(huán)境噪音進(jìn)行語(yǔ)音識(shí)別的機(jī)器人在審
| 申請(qǐng)?zhí)枺?/td> | 201611103797.3 | 申請(qǐng)日: | 2016-12-05 |
| 公開(kāi)(公告)號(hào): | CN108154880A | 公開(kāi)(公告)日: | 2018-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 胡揚(yáng);鄔惠林 | 申請(qǐng)(專利權(quán))人: | 廣東大倉(cāng)機(jī)器人科技有限公司;鄔惠林 |
| 主分類號(hào): | G10L15/20 | 分類號(hào): | G10L15/20;G10L25/84 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 523000 廣東省東莞市東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 環(huán)境噪音 音頻數(shù)據(jù) 機(jī)器人 語(yǔ)音識(shí)別 分辨 語(yǔ)音識(shí)別模塊 實(shí)時(shí)采樣 規(guī)律性 適應(yīng)環(huán)境變化 音頻數(shù)據(jù)片段 采樣片段 人本發(fā)明 峰值比 音量 采樣 送入 噪音 分析 高峰 更新 發(fā)現(xiàn) | ||
本發(fā)明公開(kāi)了一種能實(shí)時(shí)分辨環(huán)境噪音進(jìn)行語(yǔ)音識(shí)別的機(jī)器人,其特征是:所述機(jī)器人通過(guò)實(shí)時(shí)采樣分析音頻數(shù)據(jù)中代表音量大小的峰值,將長(zhǎng)時(shí)間、規(guī)律性的峰值收錄為環(huán)境噪音閥值;所述機(jī)器人通過(guò)實(shí)時(shí)采樣分析音頻數(shù)據(jù)中出現(xiàn)新的長(zhǎng)時(shí)間、規(guī)律性存在的峰值時(shí),將新的峰值更新為新的環(huán)境噪音閥值。當(dāng)所述機(jī)器人采樣發(fā)現(xiàn),出現(xiàn)了比環(huán)境噪音閥值更高峰值的音頻數(shù)據(jù)片段時(shí),才將采樣片段送入語(yǔ)音識(shí)別模塊進(jìn)行正式的語(yǔ)音識(shí)別,直到最新音頻數(shù)據(jù)的峰值比噪音閥值低,視為片段結(jié)束。本發(fā)明的有益效果是,能夠適應(yīng)環(huán)境變化,實(shí)時(shí)分辨環(huán)境噪音,解決了無(wú)效的音頻數(shù)據(jù)對(duì)語(yǔ)音識(shí)別模塊的影響,提高了機(jī)器人的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及一種機(jī)器人,尤其涉及一種能實(shí)時(shí)分辨環(huán)境噪音進(jìn)行語(yǔ)音識(shí)別的機(jī)器人。
背景技術(shù)
現(xiàn)有機(jī)器人的語(yǔ)音識(shí)別模塊和命令詞識(shí)別模塊在嘈雜環(huán)境下很難正確地識(shí)別。雖然上述模塊本身自帶了降噪、提取語(yǔ)音特征等處理,但是一旦進(jìn)入了識(shí)別狀態(tài),模塊本身的實(shí)時(shí)性將會(huì)大幅下降,甚至因?yàn)闊o(wú)意義的噪音過(guò)多而導(dǎo)致識(shí)別出錯(cuò)。而對(duì)于音頻本身進(jìn)行降噪、提取語(yǔ)音特征等處理后再送入識(shí)別系統(tǒng)的方法又過(guò)于冗余,對(duì)計(jì)算機(jī)性能要求很高,而且這種方法還存在降噪后音頻失真的問(wèn)題。
發(fā)明內(nèi)容
為了克服上述缺點(diǎn), 本發(fā)明提供了一種能實(shí)時(shí)分辨環(huán)境噪音進(jìn)行語(yǔ)音識(shí)別的機(jī)器人。
本發(fā)明為實(shí)現(xiàn)上述目的所采用的技術(shù)方案是:
一種能實(shí)時(shí)分辨環(huán)境噪音進(jìn)行語(yǔ)音識(shí)別的機(jī)器人,其特征是:
所述機(jī)器人通過(guò)實(shí)時(shí)采樣分析音頻數(shù)據(jù)中代表音量大小的峰值,將長(zhǎng)時(shí)間、規(guī)律性的峰值收錄為環(huán)境噪音閥值;所述機(jī)器人通過(guò)實(shí)時(shí)采樣分析音頻數(shù)據(jù)中出現(xiàn)新的長(zhǎng)時(shí)間、規(guī)律性存在的峰值時(shí),將新的峰值更新為新的環(huán)境噪音閥值。當(dāng)所述機(jī)器人采樣發(fā)現(xiàn),出現(xiàn)了比環(huán)境噪音閥值更高峰值的音頻數(shù)據(jù)片段時(shí),才將采樣片段送入語(yǔ)音識(shí)別模塊進(jìn)行正式的語(yǔ)音識(shí)別,直到最新音頻數(shù)據(jù)的峰值比噪音閥值低,視為片段結(jié)束。
本發(fā)明的有益效果是,能夠適應(yīng)環(huán)境變化,實(shí)時(shí)分辨環(huán)境噪音,解決了無(wú)效的音頻數(shù)據(jù)對(duì)語(yǔ)音識(shí)別模塊的影響,提高了機(jī)器人的效率。
附圖說(shuō)明
下面結(jié)合附圖和實(shí)施對(duì)本發(fā)明進(jìn)一步說(shuō)明。圖1是本發(fā)明的方框圖。
圖1中,1是采樣音頻數(shù)據(jù),2是判斷確定環(huán)境噪音閥值,3是再次確定環(huán)境噪音閥值
具體實(shí)施方式
在圖1中,所述機(jī)器人通過(guò)實(shí)時(shí)采樣音頻數(shù)據(jù)1分析音頻數(shù)據(jù)中代表音量大小的峰值,比如2秒時(shí)間、規(guī)律性存在的峰值為35,就把35確定為環(huán)境噪音閥值2;所述機(jī)器人通過(guò)實(shí)時(shí)采樣分析音頻數(shù)據(jù)中出現(xiàn)新的2秒時(shí)間、規(guī)律性存在的峰值45時(shí),將新的峰值45更新為新的環(huán)境噪音閥值。當(dāng)所述機(jī)器人采樣發(fā)現(xiàn),比環(huán)境噪音閥值45更高峰值55的音頻數(shù)據(jù)片段時(shí),才將此采樣片段送入語(yǔ)音識(shí)別模塊進(jìn)行正式的語(yǔ)音識(shí)別5,直到最新音頻數(shù)據(jù)的峰值42比噪音閥值45低,視為片段結(jié)束。
以上所述,僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,任何未脫離本發(fā)明方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東大倉(cāng)機(jī)器人科技有限公司;鄔惠林,未經(jīng)廣東大倉(cāng)機(jī)器人科技有限公司;鄔惠林許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611103797.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種音頻調(diào)整方法、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 音頻數(shù)據(jù)識(shí)別方法及系統(tǒng)
- 消除背景音頻數(shù)據(jù)的方法、裝置和系統(tǒng)
- 音頻數(shù)據(jù)確定方法、裝置、設(shè)備和介質(zhì)
- 音頻分類的方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 一種音頻處理方法及電子設(shè)備
- 一種音頻傳輸方法和裝置
- 一種音頻數(shù)據(jù)生成方法、音頻數(shù)據(jù)轉(zhuǎn)寫方法及其裝置
- 語(yǔ)音數(shù)據(jù)的處理方法、裝置及電子設(shè)備
- 模型訓(xùn)練、數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 語(yǔ)音識(shí)別系統(tǒng)和方法
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 一種語(yǔ)音識(shí)別設(shè)備的更新方法、裝置及系統(tǒng)
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種基于手機(jī)互聯(lián)的車載語(yǔ)音識(shí)別系統(tǒng)及識(shí)別方法
- 一種基于云計(jì)算與置信度計(jì)算的語(yǔ)音識(shí)別方法與系統(tǒng)
- 語(yǔ)音識(shí)別方法和裝置
- 一種用于調(diào)度機(jī)的語(yǔ)音識(shí)別裝置
- 語(yǔ)音識(shí)別方法、裝置、系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì)
- 模型訓(xùn)練、語(yǔ)音識(shí)別方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





