[發(fā)明專(zhuān)利]音頻帶寬減小有效
| 申請(qǐng)?zhí)枺?/td> | 202010744942.6 | 申請(qǐng)日: | 2020-07-29 |
| 公開(kāi)(公告)號(hào): | CN112312297B | 公開(kāi)(公告)日: | 2022-08-02 |
| 發(fā)明(設(shè)計(jì))人: | C·T·尤班克;L·加布爾;M·S·康諾利;R·D·西爾維法斯特;S·A·拉姆普拉沙德;C·阿文達(dá)諾;M·E·馬科斯 | 申請(qǐng)(專(zhuān)利權(quán))人: | 蘋(píng)果公司 |
| 主分類(lèi)號(hào): | H04S7/00 | 分類(lèi)號(hào): | H04S7/00;H04R5/02;G10L21/0272;G10L21/0216;G10L21/0208 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 黃倩 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 帶寬 減小 | ||
本公開(kāi)涉及音頻帶寬減小。第一設(shè)備從陣列獲得若干音頻信號(hào)并且處理所述音頻信號(hào)以產(chǎn)生語(yǔ)音信號(hào)和一個(gè)或多個(gè)環(huán)境信號(hào)。所述第一設(shè)備處理所述環(huán)境信號(hào)以產(chǎn)生聲音對(duì)象聲音描述符,所述聲音對(duì)象聲音描述符具有描述聲學(xué)環(huán)境內(nèi)的聲音對(duì)象的元數(shù)據(jù)。所述第一設(shè)備通過(guò)通信數(shù)據(jù)鏈路將所述語(yǔ)音信號(hào)和所述描述符傳輸?shù)降诙娮釉O(shè)備,所述第二電子設(shè)備被配置為使用與所述語(yǔ)音信號(hào)混合的所述描述符空間地再現(xiàn)所述聲音對(duì)象,以產(chǎn)生若干混合信號(hào)來(lái)驅(qū)動(dòng)若干揚(yáng)聲器。
技術(shù)領(lǐng)域
本公開(kāi)的一個(gè)方面涉及一種電子設(shè)備,該電子設(shè)備執(zhí)行帶寬減小操作以減少要通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)傳輸?shù)搅硪浑娮釉O(shè)備的數(shù)據(jù)量。
背景技術(shù)
頭戴受話器是包括一對(duì)揚(yáng)聲器的音頻設(shè)備,當(dāng)頭戴受話器配戴在用戶頭上或圍繞用戶頭部配戴時(shí),每個(gè)揚(yáng)聲器被放置在用戶的耳朵上。類(lèi)似于頭戴受話器,耳機(jī)(或入耳式頭戴受話器)是兩個(gè)分開(kāi)的音頻設(shè)備,每個(gè)音頻設(shè)備具有插入到用戶耳朵中的揚(yáng)聲器。頭戴受話器和耳機(jī)通常有線連接到單獨(dú)的回放設(shè)備諸如數(shù)字音頻播放器,該回放設(shè)備以音頻信號(hào)驅(qū)動(dòng)設(shè)備的每個(gè)揚(yáng)聲器以便生成聲音(例如,音樂(lè))。頭戴受話器和耳機(jī)提供用戶可用以單獨(dú)收聽(tīng)音頻內(nèi)容而不必將音頻內(nèi)容廣播給附近其他人的一種方便的方法。
發(fā)明內(nèi)容
本公開(kāi)的一個(gè)方面是一種系統(tǒng),該系統(tǒng)執(zhí)行帶寬減小操作以減少在參與通信會(huì)話(例如,IP語(yǔ)音(VoIP)電話呼叫)的兩個(gè)電子設(shè)備(例如,音頻源設(shè)備和音頻接收器設(shè)備)之間傳輸?shù)囊纛l數(shù)據(jù)量。例如,兩個(gè)設(shè)備可經(jīng)由無(wú)線通信數(shù)據(jù)鏈路(例如,通過(guò)無(wú)線網(wǎng)絡(luò)諸如局域網(wǎng)(LAN))參與會(huì)話,該無(wú)線通信數(shù)據(jù)鏈路的帶寬或可用吞吐量可根據(jù)若干因素而變化。例如,帶寬可根據(jù)通過(guò)無(wú)線網(wǎng)絡(luò)進(jìn)行無(wú)線通信的其他設(shè)備的數(shù)量以及源設(shè)備與無(wú)線接入點(diǎn)(或無(wú)線路由器)之間的距離而變化。本公開(kāi)提供了一種系統(tǒng),該系統(tǒng)用于通過(guò)減少在兩個(gè)設(shè)備之間交換的音頻數(shù)據(jù)量來(lái)減少進(jìn)行通信會(huì)話所需的帶寬量。系統(tǒng)包括音頻源設(shè)備和音頻接收器設(shè)備,兩者都可以是通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))進(jìn)行通信的頭戴式設(shè)備(HMD)。源設(shè)備獲得由設(shè)備的麥克風(fēng)陣列捕獲的若干麥克風(fēng)音頻信號(hào)。源設(shè)備處理音頻信號(hào)以將語(yǔ)音信號(hào)(例如,包含源設(shè)備的用戶的語(yǔ)音)與包含來(lái)自源設(shè)備所在的聲學(xué)環(huán)境的環(huán)境聲音的一個(gè)或多個(gè)環(huán)境信號(hào)分離。源設(shè)備處理音頻信號(hào)以產(chǎn)生聲音對(duì)象聲音描述符,該聲音對(duì)象聲音描述符具有描述聲學(xué)環(huán)境內(nèi)的一個(gè)或多個(gè)聲音對(duì)象的元數(shù)據(jù),諸如狗吠或在空中飛行的直升機(jī)。元數(shù)據(jù)可包括索引標(biāo)識(shí)符,該索引標(biāo)識(shí)符將聲音對(duì)象唯一地識(shí)別為源設(shè)備和/或接收器設(shè)備先前已知的聲音庫(kù)內(nèi)的成員或條目。元數(shù)據(jù)還可包括指示聲音對(duì)象的位置的位置數(shù)據(jù)(例如,狗吠在源設(shè)備的左側(cè))和指示聲音對(duì)象在麥克風(fēng)陣列處的聲級(jí)的響度數(shù)據(jù)。源設(shè)備將聲音描述符(其相對(duì)于可與聲音對(duì)象相關(guān)聯(lián)的音頻數(shù)據(jù)具有減小的文件大小)和語(yǔ)音信號(hào)傳輸?shù)揭纛l接收器設(shè)備。接收器設(shè)備使用聲音描述符空間地再現(xiàn)聲音對(duì)象,并且將再現(xiàn)的聲音對(duì)象與語(yǔ)音信號(hào)混合以產(chǎn)生若干混合信號(hào)來(lái)驅(qū)動(dòng)若干揚(yáng)聲器。
在一個(gè)方面,系統(tǒng)使用聲音描述符的元數(shù)據(jù)來(lái)產(chǎn)生聲音對(duì)象的再現(xiàn),該再現(xiàn)包括音頻信號(hào)和指示聲音對(duì)象的虛擬聲源的位置的位置數(shù)據(jù)。例如,接收器設(shè)備可使用索引標(biāo)識(shí)符來(lái)對(duì)具有預(yù)定義聲音對(duì)象的一個(gè)或多個(gè)條目且每個(gè)條目具有對(duì)應(yīng)的唯一標(biāo)識(shí)符的聲音庫(kù)執(zhí)行表查找,使用唯一標(biāo)識(shí)符來(lái)識(shí)別具有匹配的唯一標(biāo)識(shí)符的預(yù)定義聲音對(duì)象。在識(shí)別預(yù)定義聲音對(duì)象時(shí),接收器設(shè)備從聲音庫(kù)中檢索包括存儲(chǔ)在聲音庫(kù)內(nèi)的音頻信號(hào)的聲音對(duì)象。接收器設(shè)備根據(jù)位置數(shù)據(jù)空間地渲染音頻信號(hào)以產(chǎn)生與語(yǔ)音信號(hào)混合的若干雙耳音頻信號(hào)來(lái)驅(qū)動(dòng)若干揚(yáng)聲器。
在一個(gè)方面,系統(tǒng)可產(chǎn)生描述其他類(lèi)型的聲音的其他聲音描述符。例如,系統(tǒng)可產(chǎn)生聲音床聲音描述符,該聲音床聲音描述符描述環(huán)境或擴(kuò)散背景噪聲或作為環(huán)境的聲音床的一部分的聲音。又如,系統(tǒng)可產(chǎn)生音素聲音描述符,該音素聲音描述符包括可以是語(yǔ)音信號(hào)的文本表示的音素?cái)?shù)據(jù)。這些聲音描述符中的每一者,包括聲音對(duì)象聲音描述符,可具有比包含類(lèi)似聲音的對(duì)應(yīng)音頻信號(hào)減小的文件大小。因此,系統(tǒng)可基于帶寬或可用吞吐量傳輸任何數(shù)量的聲音描述符的組合代替實(shí)際音頻信號(hào)。例如,如果帶寬或可用吞吐量有限,則聲源設(shè)備可傳輸音素聲音描述符而不是語(yǔ)音信號(hào)(其原本將需要更多帶寬)。音頻接收器設(shè)備可基于音素聲音描述符來(lái)合成語(yǔ)音信號(hào)代替由音頻源設(shè)備產(chǎn)生的語(yǔ)音信號(hào),以用于通過(guò)至少一個(gè)揚(yáng)聲器輸出。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于蘋(píng)果公司,未經(jīng)蘋(píng)果公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010744942.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





