[發明專利]視頻處理裝置、方法和服務器在審
| 申請號: | 201310565555.6 | 申請日: | 2013-11-13 |
| 公開(公告)號: | CN103945141A | 公開(公告)日: | 2014-07-23 |
| 發明(設計)人: | 奈杰爾·穆爾 | 申請(專利權)人: | 索尼公司;索尼歐洲有限公司 |
| 主分類號: | H04N5/278 | 分類號: | H04N5/278;H04N21/235;H04N21/435;G06F17/28 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 余剛;吳孟秋 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 處理 裝置 方法 服務器 | ||
相關申請的交叉引用
本申請要求于2013年1月23日提交至UKIPO的英國專利申請第GB1301194.5號的優先權,通過引用將其全部內容結合于此。
技術領域
本公開涉及視頻處理裝置,例如機頂盒、客戶端設備或視頻處理器,其適用于生成例如在電視機上顯示的視頻信號。
本技術的實施方式可提供一種顯示諸如字幕之類的視頻圖像中的文本的設置,其中文本的語言適合滿足用戶的要求。
背景技術
已知在視頻圖像內提供字幕以允許對廣播視頻信號中的音頻音軌的語言不熟悉的用戶能夠理解和跟上音頻音軌的內容。例如,與提供有日語解說或講演的音頻音軌一起傳輸的視頻信號可以設置有表示例如英語文本的數據,從而使得不懂日語的人可以跟上以及理解演講的內容以及跟上視頻圖像中的動作。其可以由于以下原因而被需求,例如用戶可能不懂廣播中的原始音頻音軌的語言,或者用戶可能耳聾或者在聽覺方面有困難,因此可以只閱讀標識伴隨視頻信號的音軌中的演講的文本。在另一例子中,收聽的人可能希望接收原始聲音,以及使用所謂的字幕來跟上演講。
已知提供伴隨視頻信號的數據,在視頻信號中,數據提供文本以便插入到由視頻信號表示的視頻圖像中,從而提供字幕給觀眾。此外,已知提供用多于一種語言表示文本的數據。然而,仍然存在技術問題,因為不可能提供用戶可接收的視頻和音頻信號的所有語言的文本,并且用戶可能會需要不能用于該文件的語言。
應理解,希望改進在視頻圖像中再現文本或者在視頻圖像上層疊文本的視頻圖像和音頻音軌的質量。
發明內容
根據本公開的方面,提供了一種視頻處理裝置,該視頻處理裝置包括通信單元、視頻處理器和控制器。控制器和通信單元被合并在一起用于從源接收表示用于顯示的視頻圖像的視頻數據,接收表示將要在視頻圖像內再現的文本的第一數據,該文本依照第一語言??刂破鞅慌渲脼槭褂猛ㄐ艈卧獙⒌谝粩祿ㄐ诺奖慌渲脼閷⑽谋緩牡谝徽Z言轉換到第二語言并且形成第二數據的遠程終端,以接收表示第二語言的文本的第二數據。視頻生成處理器被配置為處理視頻數據以及第二數據以便生成用于再現視頻圖像的顯示信號,該視頻圖像具有插入到視頻圖像中的依照第二語言的文本,該文本與視頻圖像相關聯。
本技術的實施方式可提供視頻處理裝置被配置為當接收具有提供第一語言的文本的第一數據時,生成第二語言的文本的布置。視頻生成裝置將表示第一語言的文本的第一數據通信到遠程終端,并且從遠程終端接收表示第二語言的文本的第二數據,以便用第二語言顯示給用戶。因此,翻譯服務可在例如遠程服務器上提供,在遠程服務器中,第一語言被轉換到用于顯示給用戶的第二語言。
此外,在一些示例中,調整依照第二語言的文本使得該文本在視頻圖像中占據與第一語言的文本相同的區域。這是因為一些語言需要不同數量的字詞以及不同排列方式的字詞以便表達與其他語言相同的意思。例如,通常正確的是,表達相同的意思,德語和法語的字詞數量比英語要多。因此,通過將字詞變形、簡化(abbreviate,縮寫)字詞、字詞內換行字詞內換行(wrap?words?around)或是減少字體尺寸來調整文本,使得第二語言的文本在視頻圖像中占用與第一語言相同的區域,然后顯示的字幕文本將不會模糊正在顯示的視頻圖像中的更多區域。在一些示例中,視頻圖像可包括針對必須不能被形成字幕的文本覆蓋的圖像的保留區域。因此,視頻處理裝置可調整依照第二語言的文本,以便在顯示該文本時,不會干擾保留區域。
本公開各種進一步的方面在所附的權利要求中定義,權利要求包括遠程終端、處理視頻圖像的方法以及翻譯用于插入到視頻圖像中的文本的方法。
附圖說明
參照相似部件設置有相同參考數字的附圖僅通過示例的方式來描述本公開的實施方式,并且其中:
圖1是表示可形成客戶設備或機頂盒的視頻處理裝置接收與表示第一語言的文本的數據相結合的視頻以及音頻數據,并且顯示具有第二語言的文本的視頻圖像的示例布置的示意性框圖;
圖2是表示接收的用于在圖像內顯示的文本的數據的文件格式的示例;
圖3a是用于傳遞具有文本數據的音頻/視頻數據的示例數據文件結構的示意圖;圖3b是音頻/視頻數據/文本數據作為DASH?MPD(XML)文件來傳輸的數據文件結構的另一示圖;而圖3c是音頻/視頻數據/文本數據作為MPEG4文件的片段傳輸的數據文件結構的示例。
圖4是用第二語言(德語)的文本替代第一語言(英語)的文本的視頻圖像的示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司;索尼歐洲有限公司,未經索尼公司;索尼歐洲有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310565555.6/2.html,轉載請聲明來源鉆瓜專利網。





