[發(fā)明專利]語(yǔ)音識(shí)別系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201810479603.2 | 申請(qǐng)日: | 2018-05-18 |
| 公開(kāi)(公告)號(hào): | CN108447483A | 公開(kāi)(公告)日: | 2018-08-24 |
| 發(fā)明(設(shè)計(jì))人: | 張治宇;鐘景維;石慶;馬保軍;鄭科;張龍;程文輝;韋振劍 | 申請(qǐng)(專利權(quán))人: | 深圳市億道數(shù)碼技術(shù)有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10K11/18;G10L21/0208;G10L21/0216 |
| 代理公司: | 深圳市科吉華烽知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 44248 | 代理人: | 孫偉 |
| 地址: | 518000 廣東省深圳市寶*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音識(shí)別電路 麥克風(fēng)陣列 麥克風(fēng) 語(yǔ)音識(shí)別系統(tǒng) 聲源定位 主控制器 準(zhǔn)確率 聲源 拾音 回聲消除模塊 聲源定位模塊 噪音抑制模塊 主控單元CPU 監(jiān)聽(tīng)揚(yáng)聲器 模數(shù)轉(zhuǎn)換器 環(huán)境聲音 回聲消除 語(yǔ)音識(shí)別 噪音抑制 等邊形 云端 辨別 播放 服務(wù) | ||
本發(fā)明涉及一種語(yǔ)音識(shí)別系統(tǒng),包括服務(wù)云端、主控制器、模數(shù)轉(zhuǎn)換器、麥克風(fēng)陣列,其中,所述主控制器包括主控單元CPU、聲源定位模塊、聲源增強(qiáng)模塊、回聲消除模塊、噪音抑制模塊、以及WIFI模塊,所述麥克風(fēng)陣列包括三個(gè)呈等邊形布置的用于拾音的麥克風(fēng)。本發(fā)明采用由三個(gè)麥克風(fēng)組成的麥克風(fēng)陣列及4個(gè)通道ADC MIC與語(yǔ)音識(shí)別電路,其中三個(gè)麥克風(fēng)和對(duì)應(yīng)的三個(gè)通道ADC MIC語(yǔ)音識(shí)別電路用于拾音及聲源定位,一個(gè)通道ADC MIC語(yǔ)音識(shí)別電路用于監(jiān)聽(tīng)揚(yáng)聲器PA播放的音頻,可準(zhǔn)確實(shí)現(xiàn)聲源定位、聲源增強(qiáng)、回聲消除、噪音抑制,能提高辨別環(huán)境聲音和本機(jī)聲音的準(zhǔn)確率,從而提高語(yǔ)音識(shí)別準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音識(shí)別系統(tǒng)。
背景技術(shù)
語(yǔ)音識(shí)別技術(shù)(Auto Speech Recognize,簡(jiǎn)稱ASR)所要解決的問(wèn)題是讓計(jì)算機(jī)能夠“聽(tīng)懂”人類的語(yǔ)音,將語(yǔ)音中包含的文字信息“提取”出來(lái)。ASR技術(shù)在“能聽(tīng)會(huì)說(shuō)”的智能計(jì)算機(jī)系統(tǒng)中扮演著重要角色,相當(dāng)于給計(jì)算機(jī)系統(tǒng)安裝上“耳朵”,使其具備“能聽(tīng)”的功能,進(jìn)而實(shí)現(xiàn)信息時(shí)代利用“語(yǔ)音”這一最自然、最便捷的手段進(jìn)行人機(jī)通信和交互。
近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng),語(yǔ)音識(shí)別技術(shù)已在工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)類電子等各個(gè)領(lǐng)域上應(yīng)用。曾經(jīng)語(yǔ)音識(shí)別聽(tīng)寫(xiě)機(jī)在一些領(lǐng)域的應(yīng)用,被美國(guó)新聞界評(píng)為計(jì)算機(jī)發(fā)展十件大事之一。
隨著語(yǔ)音識(shí)別產(chǎn)品逐漸增加,許多語(yǔ)音識(shí)別和人機(jī)交互產(chǎn)品進(jìn)入人們的生活需求,對(duì)語(yǔ)音識(shí)別技術(shù)質(zhì)量要求越來(lái)越高。
現(xiàn)有多數(shù)方案采用雙麥克風(fēng)拾音或者6個(gè)麥克風(fēng)陣列做語(yǔ)音識(shí)別。對(duì)于雙麥克風(fēng),只能單純軟件上做算法降噪,同時(shí)并不能識(shí)別是本機(jī)中播放的音頻,還是環(huán)境中噪音;對(duì)于語(yǔ)音識(shí)別誤判或直接語(yǔ)意是不能識(shí)別的,或者譯錯(cuò)語(yǔ)意,特別是當(dāng)播放聲音較大時(shí),或說(shuō)話者距離機(jī)器較遠(yuǎn)時(shí)特別明顯。而采用6個(gè)麥克風(fēng)陣列的產(chǎn)品,占比空間大,產(chǎn)品外觀要做很大,軟件算法需要處理6個(gè)麥克風(fēng)的數(shù)據(jù),耗CPU資源較大,對(duì)CPU性能要求很高,整體設(shè)計(jì)方案成本過(guò)高,普通消費(fèi)類產(chǎn)品難以實(shí)現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提出一種語(yǔ)音識(shí)別系統(tǒng),旨在降低成本,提高語(yǔ)音識(shí)別準(zhǔn)確率。
為實(shí)現(xiàn)上述目的,本發(fā)明提出一種語(yǔ)音識(shí)別系統(tǒng),該系統(tǒng)包括服務(wù)云端、主控制器、模數(shù)轉(zhuǎn)換器、麥克風(fēng)陣列,其中,所述主控制器包括主控單元CPU、聲源定位模塊、聲源增強(qiáng)模塊、回聲消除模塊、噪音抑制模塊、以及WIFI模塊,所述麥克風(fēng)陣列包括三個(gè)呈等邊形布置的用于拾音的麥克風(fēng);
所述三個(gè)麥克風(fēng)中的第一麥克風(fēng)U1、第二麥克風(fēng)U2、第三麥克風(fēng)U3分別通過(guò)第一通道ADC MIC語(yǔ)音識(shí)別電路、第二通道ADC MIC語(yǔ)音識(shí)別電路、第三通道ADC MIC語(yǔ)音識(shí)別電路與所述模數(shù)轉(zhuǎn)換器連接,所述模數(shù)轉(zhuǎn)換器還通過(guò)第四通道ADC MIC語(yǔ)音識(shí)別電路與揚(yáng)聲器PA連接,所述模數(shù)轉(zhuǎn)換器用于接收所述第一麥克風(fēng)U1、第二麥克風(fēng)U2、第三麥克風(fēng)U3傳輸?shù)男盘?hào)、以及所述PA傳輸過(guò)來(lái)的模擬音頻信號(hào),并將所述第一麥克風(fēng)U1、第二麥克風(fēng)U2、第三麥克風(fēng)U3傳輸?shù)男盘?hào)、以及所述揚(yáng)聲器PA傳輸過(guò)來(lái)的模擬音頻信號(hào)轉(zhuǎn)換成數(shù)字信號(hào);
所述主控單元CPU分別與所述模數(shù)轉(zhuǎn)換器、揚(yáng)聲器PA、聲源定位模塊、聲源增強(qiáng)模塊、回聲消除模塊、噪音抑制模塊、以及WIFI模塊連接,所述主控單元CPU通過(guò)所述WIFI模塊與所述服務(wù)云端連接。
本發(fā)明的進(jìn)一步的技術(shù)方案是,還包括為所述模數(shù)轉(zhuǎn)換器內(nèi)部數(shù)字模塊供電的第一供電電源、為所述模數(shù)轉(zhuǎn)換器內(nèi)部模擬內(nèi)核供電的第二供電電源,所述第一供電電源包括第一供電電源濾波電路,所述第二供電電源包括第二供電電源濾波電路;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市億道數(shù)碼技術(shù)有限公司,未經(jīng)深圳市億道數(shù)碼技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810479603.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 虛擬麥克風(fēng)模擬器與方法
- 陣列麥克風(fēng)的測(cè)試方法、系統(tǒng)及轉(zhuǎn)動(dòng)裝置
- 用于麥克風(fēng)陣列校正的方法、裝置和系統(tǒng)
- 分布式麥克風(fēng)陣列及其適用的聲源定位系統(tǒng)
- 分布式麥克風(fēng)陣列及其適用的聲源定位系統(tǒng)
- 3D全息聲音麥克風(fēng)陣列支架
- 用于定向監(jiān)聽(tīng)通信的智能麥克風(fēng)陣列模塊
- 一種麥克風(fēng)陣列音頻信號(hào)自適應(yīng)處理方法、裝置及介質(zhì)
- 麥克風(fēng)監(jiān)控方法及裝置
- 麥克風(fēng)陣列的相位測(cè)試系統(tǒng)、方法、裝置、設(shè)備及介質(zhì)
- 一種協(xié)助記憶古詩(shī)文的學(xué)習(xí)機(jī)
- 一種協(xié)助記憶古詩(shī)文的學(xué)習(xí)機(jī)
- 對(duì)待測(cè)試語(yǔ)音識(shí)別系統(tǒng)的自動(dòng)測(cè)試方法和裝置
- 共用一套麥克風(fēng)陣列的服務(wù)機(jī)器人雙語(yǔ)音識(shí)別方法
- 一種基于云計(jì)算與置信度計(jì)算的語(yǔ)音識(shí)別方法與系統(tǒng)
- 一種視頻監(jiān)控聯(lián)網(wǎng)系統(tǒng)
- 一種用于智能出行的車輛語(yǔ)音輸入控制方法
- 一種用于智能出行的車輛語(yǔ)音輸入控制系統(tǒng)
- 一種服務(wù)機(jī)器人語(yǔ)音識(shí)別方法
- 語(yǔ)音識(shí)別系統(tǒng)優(yōu)化方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)





