[發(fā)明專利]一種智能麥克風(fēng)陣列在審
| 申請(qǐng)?zhí)枺?/td> | 201911336378.8 | 申請(qǐng)日: | 2019-12-23 |
| 公開(kāi)(公告)號(hào): | CN113096665A | 公開(kāi)(公告)日: | 2021-07-09 |
| 發(fā)明(設(shè)計(jì))人: | 周著華;汪松;宗升亞;廖新剛;闋海燕 | 申請(qǐng)(專利權(quán))人: | 上海浩宜信息科技有限公司 |
| 主分類號(hào): | G10L15/26 | 分類號(hào): | G10L15/26;G10L21/0216;G06F40/30 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 201802 上海市嘉*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 智能 麥克風(fēng) 陣列 | ||
本發(fā)明涉及一種智能麥克風(fēng)陣列,其中,包括:麥克風(fēng)陣列模塊,負(fù)責(zé)采集音頻和降噪音頻,將降噪后的音頻傳送給人工智能平臺(tái)模塊;人工智能平臺(tái)模塊接收到音頻后,將音頻通過(guò)語(yǔ)音識(shí)別能力處理模塊處理得到識(shí)別文本,將文本通過(guò)語(yǔ)義理解能力處理模塊處理得到語(yǔ)義結(jié)果,將文本通過(guò)語(yǔ)音合成能力處理模塊處理得到合成音頻,四麥環(huán)形麥克風(fēng)陣列由四個(gè)麥克風(fēng)環(huán)形間隔排列。本發(fā)明中集成了離線的人工智能平臺(tái),提供了離線的語(yǔ)音識(shí)別、語(yǔ)音合成和語(yǔ)義理解的能力。可以在不聯(lián)網(wǎng)的情況下提供高效快速的人工智能能力,配合高速處理芯片,讓人工智能能力進(jìn)一步提升。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能、音頻降噪領(lǐng)域,尤其是一種帶人工智能能力的智能麥克風(fēng)陣列。
背景技術(shù)
麥克風(fēng)陣列(Microphone Array)是一個(gè)特指應(yīng)用于語(yǔ)音處理的系統(tǒng),是一組位于空間不同位置的全向麥克風(fēng)按一定的形狀規(guī)則布置形成的陣列,是對(duì)空間傳播聲音信號(hào)進(jìn)行空間采樣的一種裝置,主要解決在特定場(chǎng)景語(yǔ)音識(shí)別的問(wèn)題,以保證真實(shí)場(chǎng)景下的語(yǔ)音識(shí)別率。
語(yǔ)音識(shí)別(Auto Speech Recognize,ASR)技術(shù),是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程使之聽(tīng)懂人類語(yǔ)言的技術(shù)。語(yǔ)音識(shí)別技術(shù)是信息技術(shù)中人機(jī)交互的關(guān)鍵技術(shù),目前已經(jīng)在呼叫中心、電信增值業(yè)務(wù)、企業(yè)信息化系統(tǒng)中有了廣泛的應(yīng)用。隨著語(yǔ)音識(shí)別在語(yǔ)音搜索、語(yǔ)音控制等全新應(yīng)用領(lǐng)域的深入應(yīng)用,語(yǔ)音識(shí)別技術(shù)被業(yè)界權(quán)威人士譽(yù)為有可能引發(fā)人機(jī)界面領(lǐng)域革命的關(guān)鍵技術(shù)。自動(dòng)語(yǔ)音識(shí)別技術(shù)所要解決的問(wèn)題是讓計(jì)算機(jī)能夠“聽(tīng)懂”人類的語(yǔ)音,將語(yǔ)音中包含的文字信息“提取”出來(lái)。ASR技術(shù)在“能聽(tīng)會(huì)說(shuō)”的智能計(jì)算機(jī)系統(tǒng)中扮演著重要角色,相當(dāng)于給計(jì)算機(jī)系統(tǒng)安裝上“耳朵”,使其具備“能聽(tīng)”的功能,進(jìn)而實(shí)現(xiàn)信息時(shí)代利用“語(yǔ)音”這一最自然、最便捷的手段進(jìn)行人機(jī)通信和交互。
語(yǔ)音合成(Text To Speech,TTS)技術(shù)能夠自動(dòng)將任意文字實(shí)時(shí)轉(zhuǎn)換為連續(xù)的自然語(yǔ)音,是一種能夠在任何時(shí)間、任何地點(diǎn),向任何人提供語(yǔ)音信息服務(wù)的高效便捷手段,非常符合信息時(shí)代海量數(shù)據(jù)、動(dòng)態(tài)更新和個(gè)生化查詢的需求。
語(yǔ)義理解(Natural Language Processing,NLP)自然語(yǔ)言處理,即實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信,或?qū)崿F(xiàn)自然語(yǔ)言理解和自然語(yǔ)言生成是十分困難的。造成困難的根本原因是自然語(yǔ)言文本和對(duì)話的各個(gè)層次上廣泛存在的各種各樣的歧義性或多義性(ambiguity)。
目前的麥克風(fēng)產(chǎn)品存在以下缺點(diǎn):
不能有效的提供特定場(chǎng)景下的降噪需求,目前的麥克風(fēng)產(chǎn)品不管是雙麥降噪還是多麥降噪、線形排列還是環(huán)形排列,都只能針對(duì)單一場(chǎng)景的降噪需求。因?yàn)榻翟胨惴ㄖ挥幸环N,無(wú)法變更。
市場(chǎng)對(duì)麥克風(fēng)降噪需求的同時(shí),一般也需求語(yǔ)音識(shí)別等的人工智能服務(wù)的需求。但是如果只是通過(guò)降噪麥克風(fēng)采集音頻,并且通過(guò)私有云或者公有云進(jìn)行語(yǔ)音識(shí)別,都會(huì)存在網(wǎng)絡(luò)延時(shí)、數(shù)據(jù)安全、并發(fā)需求大服務(wù)器性能無(wú)法滿足等的問(wèn)題。
因此,設(shè)計(jì)一種智能麥克風(fēng)陣列(即將人工智能平臺(tái)集成進(jìn)麥克風(fēng)陣列產(chǎn)品)應(yīng)對(duì)當(dāng)前的音頻采集和降噪、語(yǔ)音識(shí)別等的人工智能服務(wù)就很有必要了。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種智能麥克風(fēng)陣列,解決當(dāng)下網(wǎng)絡(luò)延時(shí)、數(shù)據(jù)安全、高并發(fā)下服務(wù)器性能不足的問(wèn)題。
本發(fā)明是一種智能麥克風(fēng)陣列,其中,包括:麥克風(fēng)陣列模塊,負(fù)責(zé)采集音頻和降噪音頻,將降噪后的音頻傳送給人工智能平臺(tái)模塊;人工智能平臺(tái)模塊接收到音頻后,將音頻通過(guò)語(yǔ)音識(shí)別能力處理模塊處理得到識(shí)別文本,將文本通過(guò)語(yǔ)義理解能力處理模塊處理得到語(yǔ)義結(jié)果,將文本通過(guò)語(yǔ)音合成能力處理模塊處理得到合成音頻,四麥環(huán)形麥克風(fēng)陣列由四個(gè)麥克風(fēng)環(huán)形間隔排列。
根據(jù)本發(fā)明的智能麥克風(fēng)陣列的一實(shí)施例,其中,還包括:降噪芯片,用于接麥克風(fēng)陣列的音頻降噪,得到單聲道音頻。
根據(jù)本發(fā)明的智能麥克風(fēng)陣列的一實(shí)施例,其中,智能麥克風(fēng)陣列和PC以及智能銀行柜員機(jī)之間通過(guò)USB連接,并且通過(guò)USB供電。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海浩宜信息科技有限公司,未經(jīng)上海浩宜信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911336378.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





