[發(fā)明專利]用于視頻記錄期間的聲音的改善音頻信號呈現(xiàn)的方法和組件有效
| 申請?zhí)枺?/td> | 201180056659.3 | 申請日: | 2011-11-24 |
| 公開(公告)號: | CN103329145B | 公開(公告)日: | 2017-06-27 |
| 發(fā)明(設(shè)計)人: | I.格斯特爾貝格爾;C.哈特曼;M.邁爾 | 申請(專利權(quán))人: | 無線電廣播技術(shù)研究所有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G11B27/28;H04N5/60;G11B27/034;G11B27/32 |
| 代理公司: | 中國專利代理(香港)有限公司72001 | 代理人: | 徐紅燕,李浩 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 視頻 記錄 期間 聲音 改善 音頻 信號 呈現(xiàn) 方法 組件 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及用于視頻記錄期間的聲音、特別是運動特定聲音的改善音頻呈現(xiàn)的方法和組件。此類方法和此類組件可從DE 10 2008 045 397 A1已知。
背景技術(shù)
借助于伴隨有多通道電視聲音的寬屏格式的高清晰電視圖像的引入,特別是在體育事件的傳輸期間,電視觀眾與常規(guī)電視技術(shù)相比明顯更多地被卷入到體育運動中,因為明顯更多的細節(jié)是可感知的。針對直播體育事件的圖像和音頻記錄,經(jīng)常地不能以足夠的數(shù)目或在期望的接近于重要聲源的區(qū)域中安裝麥克風。這些主要是聲音,其是用于特定運動的特性并強調(diào)圖像內(nèi)容的直接性。相應地,例如,在足球比賽的電視記錄中,只有場上的極少數(shù)或沒有比賽特定聲音通常是可感知的,因為到圍繞場地的定向麥克風的距離相對于嘈雜的體育場氣氛而言太大了。對于滑雪賽跑的電視記錄而言,具有麥克風的數(shù)千米長的滑雪道的完全覆蓋將是過于昂貴的。因此,為了比賽場景或賽跑的密切記錄,特性聲音通常未被音頻記錄捕捉。
根據(jù)DE 10 2008 045 397 A1,為了在球類運動事件的視頻記錄期間捕捉運動特定聲音,已知提供具有至少兩個定向麥克風的強定向麥克風系統(tǒng),所述至少兩個定向麥克風中的每一個被借助于可沿著空間的所有方向活動的引導實體而朝著球的當前位置對準。生產(chǎn)期間的麥克風的引導在沒有人工干預的情況下自動地發(fā)生,依賴于借助于球跟蹤方法生成的球位置數(shù)據(jù)。
然而,這種已知音頻記錄技術(shù)不能應用于每個視頻記錄,并且要求相當高的技術(shù)努力。
發(fā)明內(nèi)容
本發(fā)明要解決的問題是根據(jù)在開頭描述的設(shè)計來創(chuàng)建方法和組件,其允許在任何視頻記錄期間以減少的技術(shù)努力獲得聲音的改善的音頻呈現(xiàn)。
根據(jù)本發(fā)明,針對其中在最初基于傳感器捕捉圖像內(nèi)容并進行分析的方法來解決此問題。借助于由此獲得的信息,根據(jù)預定義標準從聲音數(shù)據(jù)庫中選擇擬合聲音事件。所選聲音事件被自動地添加到整個視頻音頻混合的附加分量,在下文中稱為視頻伴音。
用于執(zhí)行根據(jù)本發(fā)明的方法的組件由三個核心部件組成:傳感器實體,用于檢測視頻圖像的特性圖像內(nèi)容;中央控制單元,分析所檢測的圖像內(nèi)容,并基于該圖像內(nèi)容從音頻數(shù)據(jù)庫中選擇擬合于所檢測圖像內(nèi)容的音頻樣本,其在混合器控制臺中被混合到視頻伴音。
附圖說明
根據(jù)借助于僅僅示例性且非限制性示例給出的將參考附圖來閱讀的以下詳細描述,本發(fā)明將變得完全清楚,在所述附圖中:
圖1示出了具有三個核心部件:傳感器實體、中央控制單元以及音頻數(shù)據(jù)庫的用于執(zhí)行根據(jù)本發(fā)明的方法的組件的示意性方框圖;
圖2示出了根據(jù)圖1的組件的中央控制單元的細節(jié);并且
圖3示出了用于音頻數(shù)據(jù)庫中的音頻樣本到不同種類的分類(樣本映射)的示例。
具體實施方式
在圖1中示意性地示出了用于執(zhí)行根據(jù)本發(fā)明的方法的組件1包括用于檢測視頻圖像的圖像內(nèi)容的傳感器實體10。所檢測圖像內(nèi)容被傳感器實體10以數(shù)據(jù)11的形式提供給基于軟件的分析和處理單元30,其在圖2中更詳細地示出并將在稍后解釋。
例如,由電視照相機提供的運動事件的實時圖像(在圖1中和以下描述中稱為“傳輸圖像”)可以被用作用于檢測圖像內(nèi)容的視頻圖像。傳感器實體10例如使用來自“機器視覺”(計算機視覺)領(lǐng)域的算法來執(zhí)行傳輸圖像的分析。這些算法特別地允許針對圖像背景進行運動對象的分離和跟蹤以及根據(jù)圖像區(qū)段來確定其位置。以足球比賽為例,可以相應地確定球在場上的位置以及圖像區(qū)段中所示的所有球員的位置和尺寸。此外,可以借助于球員的球衣來將球員分配給不同的球隊以及計算球的運動方向和速度。傳輸圖像的檢測(以及分析和處理單元30中的隨后分析;圖1)此外提供能夠在比賽記錄期間使用多個電視照相機來推導出圖像導演當前所選擇(“切割”)的電視照相機的位置和焦距的優(yōu)點。
補充性地,在傳感器實體10中及分析和處理單元30中,也可以進行音頻信號的記錄和自動分析(在圖1和以下描述中稱為“傳輸聲音”),其表征傳輸圖像的場景內(nèi)的特定動作。例如,從傳輸聲音獲得的信息被用來在聲學上驗證借助于視頻分析檢測的圖像動作。此外,可以在傳感器實體10中提供以物理方式來確定出現(xiàn)在傳輸圖像中的參與者的動作的傳感器,以獲得運動序列的更密切定義和捕捉。這包括例如借助于GPS或無線電承載系統(tǒng)來確定參與者的當前位置。作為數(shù)據(jù)11,所述附加信息也被提供給基于軟件的分析和處理單元30。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于無線電廣播技術(shù)研究所有限公司,未經(jīng)無線電廣播技術(shù)研究所有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201180056659.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





