[發明專利]發送裝置、發送方法、接收裝置和接收方法有效
| 申請號: | 201580063452.7 | 申請日: | 2015-11-09 |
| 公開(公告)號: | CN107004419B | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 高橋和幸;北里直久 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;H04N21/236;H04N21/439;H04S5/02 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 余剛;吳孟秋 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發送 裝置 方法 接收 | ||
1.一種發送裝置,包括:
編碼單元,被配置為生成具有第一攝像機的第一視圖的視頻數據的第一視頻流、具有第二攝像機的第二視圖的視頻數據的第二視頻流,以及具有對象聲源的音頻數據和所述對象聲源的基于所述第一視圖的位置信息的音頻流,所述音頻數據對應于所述對象聲源的所述第一視圖;以及
發送單元,被配置為發送預定格式的容器,所述容器包括所述第一視頻流、所述第二視頻流、所述音頻流以及位置校正信息,所述位置校正信息用于將所述對象聲源的所述位置信息校正為基于所述第二視圖的位置信息,所述位置校正信息包括指示所述第二視圖的位置相對于所述第一視圖的位置的差值的差值分量,所述第一視圖對應于捕獲音頻數據的第一攝像機的位置,使被配置為接收所發送的容器的接收裝置能夠將所述位置校正信息的所述差值分量應用于所述音頻流,以修改所述音頻數據從所述第一攝像機的位置到所述第二攝像機的位置的對應關系。
2.根據權利要求1所述的發送裝置,其中,所述位置校正信息指示所述第一視圖和所述第二視圖的位置和方向的差值分量。
3.根據權利要求1或2所述的發送裝置,其中,將所述位置校正信息插入至所述音頻流的層中。
4.根據權利要求3所述的發送裝置,其中,將所述位置校正信息插入至包括位置信息的元數據區域中。
5.根據權利要求3所述的發送裝置,其中,將所述位置校正信息插入至用戶數據區域中。
6.根據權利要求3所述的發送裝置,其中,
當存在多個所述第二視圖時,將對應于多個所述第二視圖的多條位置校正信息插入至所述音頻流的層中,并且
將指示所述多條所述位置校正信息分別對應的所述第二視頻流的信息插入至所述容器的層中。
7.根據權利要求1或2所述的發送裝置,其中,將所述位置校正信息插入至所述第二視頻流的層中。
8.根據權利要求1或2所述的發送裝置,其中,將所述位置校正信息插入至所述容器的層中。
9.根據權利要求8所述的發送裝置,其中,將所述位置校正信息作為信令信息插入。
10.根據權利要求9所述的發送裝置,其中,
所述容器為MPEG2-TS,并且
將所述位置校正信息插入至視頻基本流環中,所述視頻基本流環對應于節目映射表的所述第二視頻流。
11.根據權利要求8所述的發送裝置,其中,插入包括所述位置校正信息的信息流。
12.一種發送方法,包括:
編碼步驟,生成具有第一攝像機的第一視圖的視頻數據的第一視頻流、具有第二攝像機的第二視圖的視頻數據的第二視頻流,以及具有對象聲源的音頻數據和所述對象聲源的基于所述第一視圖的位置信息的音頻流,所述音頻數據對應于所述對象聲源的所述第一視圖;以及
發送步驟,通過發送單元發送預定格式的容器,所述容器包括所述第一視頻流、所述第二視頻流、所述音頻流以及位置校正信息,所述位置校正信息用于將所述對象聲源的位置信息校正為基于所述第二視圖的位置信息,所述位置校正信息包括指示所述第二視圖的位置相對于所述第一視圖的位置的差值的差值分量,所述第一視圖對應于捕獲音頻數據的第一攝像機的位置,使被配置為接收所發送的容器的接收裝置能夠將所述位置校正信息的所述差值分量應用于所述音頻流,以修改所述音頻數據從所述第一攝像機的位置到所述第二攝像機的位置的對應關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580063452.7/1.html,轉載請聲明來源鉆瓜專利網。





