[發(fā)明專利]多媒體處理系統(tǒng)及音頻信號處理方法無效
| 申請?zhí)枺?/td> | 201210346471.9 | 申請日: | 2012-09-18 |
| 公開(公告)號: | CN103686136A | 公開(公告)日: | 2014-03-26 |
| 發(fā)明(設(shè)計(jì))人: | 柯杰斌 | 申請(專利權(quán))人: | 宏碁股份有限公司 |
| 主分類號: | H04N13/04 | 分類號: | H04N13/04;H04N13/00;H04N5/60;H04S7/00 |
| 代理公司: | 隆天國際知識產(chǎn)權(quán)代理有限公司 72003 | 代理人: | 張艷杰;張?jiān)≡?/td> |
| 地址: | 中國臺*** | 國省代碼: | 中國臺灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多媒體 處理 系統(tǒng) 音頻 信號 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及音頻處理,尤其涉及使用立體圖像的深度圖像以處理音頻信號的多媒體處理系統(tǒng)及音頻處理方法。
背景技術(shù)
隨著立體顯示器的發(fā)展,立體圖像的處理亦愈來愈重要。一般而言,立體圖像的取得可通過幾種方式,例如利用可得到深度圖像的深度攝影機(jī)進(jìn)行拍攝、由模擬人類雙眼視覺的雙攝影機(jī)進(jìn)行拍攝、或是由二維圖像經(jīng)過適當(dāng)?shù)膱D像處理以得到立體圖像。如圖1A所示,由二維圖像轉(zhuǎn)換至立體圖像的處理過程可約略分為幾個步驟:圖像縮小、邊緣檢測(edge?detection)、線劃追蹤(line?tracing)、深度指派(depth?assignment)、深度圖像放大及平滑化、橫向偏移(lateral?shifting),當(dāng)深度圖像建立之后,即可與原本的二維圖像結(jié)合以產(chǎn)生立體圖像(stereoscopic?image)。傳統(tǒng)二維圖像轉(zhuǎn)換為立體圖像的演算法亦可通過建立空間模型、邊緣檢測、計(jì)算消失點(diǎn)等方式,通過對一張或多張圖像的分析來建立深度圖像。
如圖1B所示,視覺深度感知因素可分為生理因素及心理因素。一般而言,二維圖像轉(zhuǎn)換為立體圖像的深度圖往往是針對幾項(xiàng)心理因素以進(jìn)行演算法的運(yùn)算。舉例來說,在心理因素上往往會認(rèn)為黃色物體、移動量大的物體或大物體的景深最淺,反過來說,在心理因素上亦會認(rèn)為藍(lán)色物體、移動量小的物體或小物體的景深最深,而且材質(zhì)接近會視為景深相同。
更進(jìn)一步,景深信息為立體顯示技術(shù)中的關(guān)鍵,但傳統(tǒng)立體顯示技術(shù)往往只著重于如何產(chǎn)生正確景深的產(chǎn)生方式,但卻鮮少利用景深信息以進(jìn)一步處理立體圖像及對應(yīng)的音頻信號。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)的缺陷,本發(fā)明提供一種多媒體處理系統(tǒng),包括:一深度分析器,用以接收一輸入圖像,并據(jù)以產(chǎn)生一深度圖像;以及一音頻處理單元,用以接收一輸入音頻信號及該深度圖像,由該深度圖像中檢測一聲音對象及其對應(yīng)的一位置信息,其中該聲音對象具有對應(yīng)的一聲音頻率范圍,其中當(dāng)該位置信息超過一預(yù)定范圍,該音頻處理單元依據(jù)該位置信息對該輸入音頻信號中的該聲音頻率范圍進(jìn)行調(diào)整以產(chǎn)生一輸出音頻信號。
本發(fā)明還提供一種音頻信號處理方法,用于一多媒體處理系統(tǒng),包括:接收一輸入圖像,并據(jù)以產(chǎn)生一深度圖像;接收一輸入音頻信號及該深度圖像,并由該深度圖像中檢測一聲音對象及其對應(yīng)的一位置信息,其中該聲音對象具有對應(yīng)的一聲音頻率范圍;以及當(dāng)該位置信息超過一預(yù)定范圍,依據(jù)該位置信息對該輸入音頻信號中的該聲音頻率范圍進(jìn)行調(diào)整以產(chǎn)生一輸出音頻信號。
附圖說明
圖1A是顯示將二維圖像轉(zhuǎn)換為立體圖像的傳統(tǒng)演算法的流程圖。
圖1B是顯示視覺深度感知因素的示意圖。
圖2是顯示依據(jù)本發(fā)明一實(shí)施例的多媒體處理系統(tǒng)200的方框圖。
圖3A~圖3D是顯示依據(jù)本發(fā)明一實(shí)施例中音頻處理單元辨識主對象以調(diào)整聲道比例的示意圖。
圖4A~圖4F是顯示依據(jù)本發(fā)明另一實(shí)施例中音頻處理單元230辨識主對象以調(diào)整聲道比例的示意圖。
圖5是顯示依據(jù)本發(fā)明一實(shí)施例中音頻處理單元所使用的特定聲音頻率的示意圖。
圖6是顯示依據(jù)本發(fā)明一實(shí)施例的音頻處理單元進(jìn)行聲音頻率調(diào)整的一示意表格。
圖7是顯示依據(jù)本發(fā)明一實(shí)施例的音頻信號處理方法的流程圖。
圖8是顯示依據(jù)本發(fā)明一實(shí)施例中音頻處理單元所檢測的多國語言的頻率范圍的示意圖。
其中,附圖標(biāo)記說明如下:
200~多媒體處理系統(tǒng);
210~深度分析器;
220~視頻處理單元;
230~音頻處理單元;
310~主對象;
410、420~對象。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于宏碁股份有限公司,未經(jīng)宏碁股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210346471.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





