[發(fā)明專(zhuān)利]攝像聲音提取方法及裝置無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210461668.7 | 申請(qǐng)日: | 2012-11-15 |
| 公開(kāi)(公告)號(hào): | CN102969003A | 公開(kāi)(公告)日: | 2013-03-13 |
| 發(fā)明(設(shè)計(jì))人: | 閆正航 | 申請(qǐng)(專(zhuān)利權(quán))人: | 東莞宇龍通信科技有限公司;宇龍計(jì)算機(jī)通信科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G10L21/0272 | 分類(lèi)號(hào): | G10L21/0272 |
| 代理公司: | 北京中博世達(dá)專(zhuān)利商標(biāo)代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 523500 廣東省東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 攝像 聲音 提取 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種攝像聲音提取方法及裝置。
背景技術(shù)
隨著音頻技術(shù)的發(fā)展,人們對(duì)音樂(lè)品質(zhì)的要求也越來(lái)越高。現(xiàn)有的音頻技術(shù)主要包括單聲道、雙聲道立體聲和聲道環(huán)繞聲。其中,單聲道音頻在錄制過(guò)程中使用一個(gè)麥克風(fēng),播放效果僅能夠體現(xiàn)出聲音的強(qiáng)弱;雙聲道立體聲音頻在錄制過(guò)程中模擬人的雙耳,在播放時(shí)使用兩個(gè)喇叭分別播放左聲道和右聲道錄制的信號(hào),能夠使聽(tīng)者既感知到聲音的強(qiáng)弱,又感知到聲音的水平方位變化;聲道環(huán)繞聲利用多個(gè)麥克風(fēng)進(jìn)行錄制,并且使用多個(gè)喇叭進(jìn)行播放,能夠讓聽(tīng)者感知聲音的空間方位,具有立體的現(xiàn)場(chǎng)感覺(jué)。
現(xiàn)有技術(shù)中至少存在如下問(wèn)題:目前的單聲道、雙聲道立體聲以及聲道環(huán)繞聲只是將麥克風(fēng)或麥克風(fēng)陣列感知的信號(hào)還原為所錄制的聲音,但是對(duì)于所錄制的聲音并沒(méi)有區(qū)分。例如,用戶(hù)用智能手機(jī)為朋友所參加的某項(xiàng)表演比賽錄像,并在錄像的同時(shí)進(jìn)行解說(shuō),當(dāng)將其錄制的聲音還原時(shí),既有解說(shuō)音也有其朋友的聲音,同時(shí)還有一定的干擾音源。由于用戶(hù)距離手機(jī)要比其朋友近得多,所以解說(shuō)聲音要遠(yuǎn)大于其朋友的聲音,再加上干擾音源的干擾,使得混合信號(hào)播放出來(lái)以后效果很差,無(wú)法對(duì)解說(shuō)者的聲音和被攝目標(biāo)的聲音進(jìn)行清晰的分辨。
發(fā)明內(nèi)容
提供一種攝像聲音提取方法及裝置,能夠解決錄像過(guò)程中由于解說(shuō)者和被攝目標(biāo)距離麥克風(fēng)遠(yuǎn)近不同而帶來(lái)的聲音強(qiáng)度差別很大的問(wèn)題,將解說(shuō)聲音和被攝目標(biāo)聲音分別清晰的播放出來(lái),并降低干擾音源的影響。
第一方面,提供一種攝像聲音提取方法,包括:
根據(jù)公式vF(t)=sF(t)+βBsB(t)+n(t)獲取第一麥克風(fēng)得到的初始聲音信號(hào)vF(t),根據(jù)公式vB(t)=sB(t)+βFsF(t)+n(t)獲取第二麥克風(fēng)得到的初始聲音信號(hào)vB(t),其中,sF(t)為被攝目標(biāo)的初始聲音信號(hào),sB(t)為解說(shuō)初始聲音信號(hào),βB為解說(shuō)聲音到第一麥克風(fēng)的衰減系數(shù),βF為被攝目標(biāo)聲音到第二麥克風(fēng)的衰減系數(shù),n(t)為噪聲信號(hào);
根據(jù)公式SF(t)=vF(t)-βBvB(t)獲取所述第一麥克風(fēng)得到的最終聲音信號(hào)SF(t),根據(jù)公式SB(t)=vB(t)-βFvF(t)獲取所述第二麥克風(fēng)得到的最終聲音信號(hào)SB(t);
對(duì)所述SF(t)和所述SB(t)進(jìn)行自動(dòng)增益調(diào)整,獲得被攝目標(biāo)的聲音信號(hào)s'F(t)和解說(shuō)聲音信號(hào)sB'(t)。
在第一種可能的實(shí)現(xiàn)方式中,在所述對(duì)所述SF(t)和所述SB(t)進(jìn)行自動(dòng)增益調(diào)整之前,還包括:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于東莞宇龍通信科技有限公司;宇龍計(jì)算機(jī)通信科技(深圳)有限公司,未經(jīng)東莞宇龍通信科技有限公司;宇龍計(jì)算機(jī)通信科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210461668.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L21-00 為了改變語(yǔ)音信號(hào)的質(zhì)量或其可識(shí)度而處理語(yǔ)音信號(hào),以產(chǎn)生另一種可聽(tīng)的或非可聽(tīng)的信號(hào),例如視覺(jué)信號(hào)或觸覺(jué)信號(hào)
G10L21-02 .語(yǔ)音增強(qiáng),例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語(yǔ)音轉(zhuǎn)換成非可聽(tīng)表達(dá)形式,例如語(yǔ)音可視化、觸覺(jué)輔助的語(yǔ)音處理
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





