[發(fā)明專利]包括集成語音分析的麥克風(fēng)單元在審
| 申請(qǐng)?zhí)枺?/td> | 202010877951.2 | 申請(qǐng)日: | 2015-12-22 |
| 公開(公告)號(hào): | CN111933158A | 公開(公告)日: | 2020-11-13 |
| 發(fā)明(設(shè)計(jì))人: | J·P·萊索;J·L·梅蘭森 | 申請(qǐng)(專利權(quán))人: | 思睿邏輯國際半導(dǎo)體有限公司 |
| 主分類號(hào): | G10L19/00 | 分類號(hào): | G10L19/00;G10L21/0208;G10L25/24;G10L25/78;H04R3/00;G10L15/00 |
| 代理公司: | 北京北翔知識(shí)產(chǎn)權(quán)代理有限公司 11285 | 代理人: | 鄭建暉;關(guān)麗麗 |
| 地址: | 英國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 包括 集成 語音 分析 麥克風(fēng) 單元 | ||
一種麥克風(fēng)單元,具有:一個(gè)換能器,用于生成音頻信號(hào);一個(gè)語音特征提取塊,用于從所述音頻信號(hào)獲得語音特征值;以及,一個(gè)數(shù)字輸出,用于供應(yīng)表示所述語音特征值的數(shù)字信號(hào)。
本申請(qǐng)是于2015年12月22日提交的名稱為“包括集成語音分析的麥克風(fēng)單元”的發(fā)明專利申請(qǐng)201580076624.4的分案申請(qǐng)。
技術(shù)領(lǐng)域
本公開內(nèi)容涉及降低數(shù)字麥克風(fēng)的接口上的數(shù)據(jù)比特率,例如以使永遠(yuǎn)開啟(Always-On)話音模式下的功率消耗最小化,但是仍然傳遞足夠的信息以允許下游的關(guān)鍵字檢測(cè)或語音識(shí)別功能。
背景技術(shù)
音頻功能在便攜式設(shè)備中正變得越來越普遍。這樣的功能不僅存在于諸如依賴音頻技術(shù)的電話的設(shè)備中,而且存在于可以由話音控制的其他可穿戴裝備或設(shè)備(例如,話音響應(yīng)玩具,諸如聽-說泰迪熊)中。這樣的設(shè)備,包括電話,將幾乎不占用它們實(shí)際傳輸語音的時(shí)間,但是一個(gè)或可能地多個(gè)麥克風(fēng)可能被持久地啟用,以接聽某個(gè)話音命令。甚至一個(gè)可穿戴附件可以是連續(xù)開啟的,等待話音命令,并且將具有很小的用于電池的空間,或可能依賴于一些太陽能采集或機(jī)械能采集,因此在連續(xù)待機(jī)模式下以及在低占空比操作模式下具有苛刻的功率消耗要求。
麥克風(fēng)換能器和放大器技術(shù)已經(jīng)改進(jìn),但是通常麥克風(fēng)封裝件需要將其輸出信號(hào)驅(qū)動(dòng)一些距離。數(shù)字傳輸提供了包括噪聲抗擾的優(yōu)點(diǎn),但是用于從麥克風(fēng)傳輸數(shù)字?jǐn)?shù)據(jù)的常規(guī)格式在一些方面不是特別有效率,所述一些方面為信號(hào)線路活動(dòng)和隨之而來的在每一邏輯電平轉(zhuǎn)變時(shí)通過供電電壓對(duì)寄生電容充電時(shí)所消耗的功率。
在包含一個(gè)或多個(gè)數(shù)字麥克風(fēng)的便攜式設(shè)備(諸如,電話或平板電腦)中,數(shù)字麥克風(fēng)信號(hào)沿著帶狀線纜或電線(flex)或甚至橫跨密集填入的印刷電路板、從麥克風(fēng)到集中化智能編解碼器芯片等具有一些距離。更糟糕的這樣的應(yīng)用是,其中麥克風(fēng)可以在頭戴式受話器或耳塞內(nèi)或在用戶的衣服上某個(gè)聲學(xué)期望的位置中,遠(yuǎn)離分布式設(shè)備的手持設(shè)備或主模塊。
然而,即使當(dāng)原本在很大程度上不活動(dòng)時(shí),也可能存在復(fù)雜的信號(hào)處理要被執(zhí)行,例如在話音觸發(fā)的喚醒期間的說話人識(shí)別,所以諸如極大地降低其中的ADC的分辨率這樣的解決方案可能導(dǎo)致不可接受的下游處理結(jié)果。
因此,要求降低橫跨有線數(shù)字傳輸鏈路來發(fā)送數(shù)字麥克風(fēng)數(shù)據(jù)時(shí)所消耗的功率,同時(shí)仍然在所傳輸?shù)男盘?hào)中傳達(dá)足夠的有用信息,以允許下游的功能(諸如,語音識(shí)別)。
圖1例示了與主機(jī)設(shè)備20(例如,電話)中的智能編解碼器22通信的常規(guī)數(shù)字麥克風(fēng)10,且圖2例示了常規(guī)數(shù)字麥克風(fēng)接口中的操作波形。主機(jī)設(shè)備20通常以諸如3MHz的頻率將時(shí)鐘CLK傳輸?shù)禁溈孙L(fēng)10,該麥克風(fēng)10使用此時(shí)鐘對(duì)ADC 12計(jì)時(shí),且從數(shù)字緩沖器接口Dout 14時(shí)鐘輸出1-比特過采樣Δ-Σ流DAT,所述1-比特過采樣Δ-Σ流DAT表示麥克風(fēng)換能器16的聲學(xué)信號(hào)輸入Px,提供ADC輸入。在該系統(tǒng)中,主機(jī)20傳輸此時(shí)鐘信號(hào)CLK消耗功率,特別是麥克風(fēng)以平均1.5MHz的轉(zhuǎn)變速率發(fā)送數(shù)據(jù)流DAT消耗功率。
可以通過以較低的時(shí)鐘速率(例如,768kHz)操作來降低功率,但是這大大增加了帶內(nèi)量化噪聲,且相反地限制了特定噪聲水平的可用帶寬。即使這樣,僅僅將功率降低到了1/4,所以功率消耗仍然是顯著的,特別是在較大形狀因素(form factor)設(shè)備中或長線纜走線時(shí)。
相比于傳輸串行多比特脈碼調(diào)制流,傳輸Δ-Σ流在數(shù)據(jù)比特率和轉(zhuǎn)變速率方面顯著更低效,但是串行多比特脈碼調(diào)制流通常要求一個(gè)附加的時(shí)鐘線來傳輸時(shí)鐘,以標(biāo)記每個(gè)多比特字的開始。
其次,我們注意到,降低Δ-Σ采樣時(shí)鐘速率的令人遺憾的副作用會(huì)是將可用帶寬在背景量化噪聲方面限制到例如8kHz而非例如20kHz。這會(huì)增加用于話音關(guān)鍵字檢測(cè)(VKD)的字差錯(cuò)率(WER)。這轉(zhuǎn)而會(huì)導(dǎo)致誤報(bào)(false positive)的發(fā)生率較高,并且系統(tǒng)可能在其喚醒模式下花費(fèi)更多的時(shí)間,從而顯著影響了平均完整系統(tǒng)功率消耗。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思睿邏輯國際半導(dǎo)體有限公司,未經(jīng)思睿邏輯國際半導(dǎo)體有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010877951.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 企業(yè)應(yīng)用集成平臺(tái)構(gòu)建方法和體系結(jié)構(gòu)
- 竹集成材折疊椅
- 高精密集成化油路板
- 一種多指標(biāo)集成試劑并行檢測(cè)任意組合集成器
- 一種多指標(biāo)集成試劑并行檢測(cè)任意組合集成器
- 一種基于響應(yīng)的高并發(fā)輕量級(jí)數(shù)據(jù)集成架構(gòu)的實(shí)現(xiàn)方法及其系統(tǒng)
- 基于測(cè)試流程改進(jìn)的系統(tǒng)集成方法及裝置
- 一種數(shù)據(jù)映射集成的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種便捷式電器置換集成灶
- 分體式集成灶用穿線裝置





