[發明專利]數字電視節目同聲翻譯輸出方法及系統在審
| 申請號: | 201611253202.2 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106791913A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 何加軍 | 申請(專利權)人: | 深圳市九洲電器有限公司 |
| 主分類號: | H04N21/233 | 分類號: | H04N21/233;H04N21/234;H04N21/235;H04N21/236;H04N21/439;H04N21/44 |
| 代理公司: | 深圳市愛迪森知識產權代理事務所(普通合伙)44341 | 代理人: | 何婷 |
| 地址: | 518057 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數字 電視節目 同聲翻譯 輸出 方法 系統 | ||
1.一種數字電視節目同聲翻譯輸出方法,其特征在于,包括如下步驟:
S10:控制音視頻終端緩沖存儲電視節目數據流;
S20:由緩沖存儲的電視節目數據流中分別解析分離出視頻數據、音頻數據以及字幕數據,并在分離時標記時間戳,為三者標記上同步標簽;
S30:對音頻數據進行分段,并將分段后的音頻數據進行解碼處理,生成分段的原始PCM數據;
S40:將分段的原始PCM數據發送到云端服務器通過預設的音色數據庫進行音色學習,匹配識別出音頻數據的音色;
S50:將原始的PCM數據在云端服務器進行用戶所需語言的文字翻譯,并將翻譯結果與字幕數據進行比對,采用字幕數據對翻譯結果進行內容和時間的同步修正;
S60:根據識別出的音色,將修正后的翻譯結果轉換成相同音色的語音數據,并將語音數據按照時間戳與視頻數據、字幕數據進行同步合成,合成新的節目數據流進行播放。
2.根據權利要求1所述的數字電視節目同聲翻譯輸出方法,其特征在于,所述步驟S20還包括:
在獲取到音頻數據后,對除人聲之外的環境聲音進行過濾。
3.根據權利要求2所述的數字電視節目同聲翻譯輸出方法,其特征在于,所述步驟S30還包括:解析字幕數據中的標點符號,獲取每一個句號處的時間位置,按照句號處的時間位置對音頻數據進行分段。
4.根據權利要求3所述的數字電視節目同聲翻譯輸出方法,其特征在于,所述步驟S60還包括:將轉換后的語音數據的振幅與原音頻數據的振幅進行比對調整,使轉換后語音數據的振幅與原音頻數據的振幅保持一致。
5.一種數字電視節目同聲翻譯輸出系統,其特征在于,包括:
電視節目緩存模塊,控制音視頻終端緩沖存儲電視節目數據流;
數據分離模塊,由緩沖存儲的電視節目數據流中分別解析分離出視頻數據、音頻數據以及字幕數據,并在分離時標記時間戳,為三者標記上同步標簽;
音頻分段模塊,對音頻數據進行分段,并將分段后的音頻數據進行解碼處理,生成分段的原始PCM數據;
音色匹配模塊,將分段的原始PCM數據發送到云端服務器通過預設的音色數據庫進行音色學習,匹配識別出音頻數據的音色;
音頻翻譯模塊,將原始的PCM數據在云端服務器進行用戶所需語言的文字翻譯,并將翻譯結果與字幕數據進行比對,采用字幕數據對翻譯結果進行內容和時間的同步修正;
音頻合成模塊,根據識別出的音色,將修正后的翻譯結果轉換成相同音色的語音數據,并將語音數據按照時間戳與視頻數據、字幕數據進行同步合成,合成新的節目數據流進行播放。
6.根據權利要求5所述的數字電視節目同聲翻譯輸出系統,其特征在于,所述數據分離模塊在獲取到音頻數據后,對除人聲之外的環境聲音進行過濾。
7.根據權利要求6所述的數字電視節目同聲翻譯輸出系統,其特征在于,所述音頻分段模塊解析字幕數據中的標點符號,獲取每一個句號處的時間位置,按照句號處的時間位置對音頻數據進行分段。
8.根據權利要求7所述的數字電視節目同聲翻譯輸出系統,其特征在于,所述音頻合成模塊將轉換后的語音數據的振幅與原音頻數據的振幅進行比對調整,使轉換后語音數據的振幅與原音頻數據的振幅保持一致。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市九洲電器有限公司,未經深圳市九洲電器有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611253202.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:移動通信網路中繼裝置
- 下一篇:一種擴展WiFi范圍的網絡設備





