[發(fā)明專利]數(shù)字電視節(jié)目同聲翻譯輸出方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201611253202.2 | 申請(qǐng)日: | 2016-12-30 |
| 公開(公告)號(hào): | CN106791913A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計(jì))人: | 何加軍 | 申請(qǐng)(專利權(quán))人: | 深圳市九洲電器有限公司 |
| 主分類號(hào): | H04N21/233 | 分類號(hào): | H04N21/233;H04N21/234;H04N21/235;H04N21/236;H04N21/439;H04N21/44 |
| 代理公司: | 深圳市愛迪森知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)44341 | 代理人: | 何婷 |
| 地址: | 518057 廣東省深圳市南*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)字 電視節(jié)目 同聲翻譯 輸出 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)字電視領(lǐng)域,尤其涉及一種數(shù)字電視節(jié)目同聲翻譯輸出方法及系統(tǒng)。
背景技術(shù)
目前,數(shù)字電視機(jī)頂盒(或電視機(jī))播放的數(shù)字電視節(jié)目聲音,都是節(jié)目中對(duì)應(yīng)的原始聲音,使得用戶能夠原汁原味的觀看電視節(jié)目。
但是,節(jié)目的原始聲音有可能是外語發(fā)聲,例如英語電視節(jié)目。外語發(fā)聲的電視節(jié)目為使聽不懂外語的觀眾能夠正常觀看,往往會(huì)提供雙語字幕,觀眾如果聽不懂外語,就只能依賴于看屏幕下方的中文字幕才能看懂電視節(jié)目?jī)?nèi)容,而觀看下方的中文字幕,往往會(huì)顧及不到電視節(jié)目中的內(nèi)容畫面,這將會(huì)很大程度的影響觀眾的觀看效果,使得觀眾不能很好的觀看電視節(jié)目,給觀眾帶來不便。
發(fā)明內(nèi)容
有鑒于此,有必要針對(duì)上述外語發(fā)聲電視節(jié)目,觀眾觀看中文字幕影響觀眾觀看電視節(jié)目,帶來不便的問題,提供一種數(shù)字電視節(jié)目同聲翻譯輸出方法及系統(tǒng)。
本發(fā)明提供的一種數(shù)字電視節(jié)目同聲翻譯輸出方法,包括如下步驟:
S10:控制音視頻終端緩沖存儲(chǔ)電視節(jié)目數(shù)據(jù)流;
S20:由緩沖存儲(chǔ)的電視節(jié)目數(shù)據(jù)流中分別解析分離出視頻數(shù)據(jù)、音頻數(shù)據(jù)以及字幕數(shù)據(jù),并在分離時(shí)標(biāo)記時(shí)間戳,為三者標(biāo)記上同步標(biāo)簽;
S30:對(duì)音頻數(shù)據(jù)進(jìn)行分段,并將分段后的音頻數(shù)據(jù)進(jìn)行解碼處理,生成分段的原始PCM數(shù)據(jù);
S40:將分段的原始PCM數(shù)據(jù)發(fā)送到云端服務(wù)器通過預(yù)設(shè)的音色數(shù)據(jù)庫進(jìn)行音色學(xué)習(xí),匹配識(shí)別出音頻數(shù)據(jù)的音色;
S50:將原始的PCM數(shù)據(jù)在云端服務(wù)器進(jìn)行用戶所需語言的文字翻譯,并將翻譯結(jié)果與字幕數(shù)據(jù)進(jìn)行比對(duì),采用字幕數(shù)據(jù)對(duì)翻譯結(jié)果進(jìn)行內(nèi)容和時(shí)間的同步修正;
S60:根據(jù)識(shí)別出的音色,將修正后的翻譯結(jié)果轉(zhuǎn)換成相同音色的語音數(shù)據(jù),并將語音數(shù)據(jù)按照時(shí)間戳與視頻數(shù)據(jù)、字幕數(shù)據(jù)進(jìn)行同步合成,合成新的節(jié)目數(shù)據(jù)流進(jìn)行播放。
在其中的一個(gè)實(shí)施方式中,所述步驟S20還包括:
在獲取到音頻數(shù)據(jù)后,對(duì)除人聲之外的環(huán)境聲音進(jìn)行過濾。
在其中的一個(gè)實(shí)施方式中,所述步驟S30還包括:解析字幕數(shù)據(jù)中的標(biāo)點(diǎn)符號(hào),獲取每一個(gè)句號(hào)處的時(shí)間位置,按照句號(hào)處的時(shí)間位置對(duì)音頻數(shù)據(jù)進(jìn)行分段。
在其中的一個(gè)實(shí)施方式中,所述步驟S60還包括:將轉(zhuǎn)換后的語音數(shù)據(jù)的振幅與原音頻數(shù)據(jù)的振幅進(jìn)行比對(duì)調(diào)整,使轉(zhuǎn)換后語音數(shù)據(jù)的振幅與原音頻數(shù)據(jù)的振幅保持一致。
本發(fā)明提供的一種數(shù)字電視節(jié)目同聲翻譯輸出系統(tǒng),包括:
電視節(jié)目緩存模塊,控制音視頻終端緩沖存儲(chǔ)電視節(jié)目數(shù)據(jù)流;
數(shù)據(jù)分離模塊,由緩沖存儲(chǔ)的電視節(jié)目數(shù)據(jù)流中分別解析分離出視頻數(shù)據(jù)、音頻數(shù)據(jù)以及字幕數(shù)據(jù),并在分離時(shí)標(biāo)記時(shí)間戳,為三者標(biāo)記上同步標(biāo)簽;
音頻分段模塊,對(duì)音頻數(shù)據(jù)進(jìn)行分段,并將分段后的音頻數(shù)據(jù)進(jìn)行解碼處理,生成分段的原始PCM數(shù)據(jù);
音色匹配模塊,將分段的原始PCM數(shù)據(jù)發(fā)送到云端服務(wù)器通過預(yù)設(shè)的音色數(shù)據(jù)庫進(jìn)行音色學(xué)習(xí),匹配識(shí)別出音頻數(shù)據(jù)的音色;
音頻翻譯模塊,將原始的PCM數(shù)據(jù)在云端服務(wù)器進(jìn)行用戶所需語言的文字翻譯,并將翻譯結(jié)果與字幕數(shù)據(jù)進(jìn)行比對(duì),采用字幕數(shù)據(jù)對(duì)翻譯結(jié)果進(jìn)行內(nèi)容和時(shí)間的同步修正;
音頻合成模塊,根據(jù)識(shí)別出的音色,將修正后的翻譯結(jié)果轉(zhuǎn)換成相同音色的語音數(shù)據(jù),并將語音數(shù)據(jù)按照時(shí)間戳與視頻數(shù)據(jù)、字幕數(shù)據(jù)進(jìn)行同步合成,合成新的節(jié)目數(shù)據(jù)流進(jìn)行播放。
在其中的一個(gè)實(shí)施方式中,所述數(shù)據(jù)分離模塊在獲取到音頻數(shù)據(jù)后,對(duì)除人聲之外的環(huán)境聲音進(jìn)行過濾。
在其中的一個(gè)實(shí)施方式中,所述音頻分段模塊解析字幕數(shù)據(jù)中的標(biāo)點(diǎn)符號(hào),獲取每一個(gè)句號(hào)處的時(shí)間位置,按照句號(hào)處的時(shí)間位置對(duì)音頻數(shù)據(jù)進(jìn)行分段。
在其中的一個(gè)實(shí)施方式中,所述音頻合成模塊將轉(zhuǎn)換后的語音數(shù)據(jù)的振幅與原音頻數(shù)據(jù)的振幅進(jìn)行比對(duì)調(diào)整,使轉(zhuǎn)換后語音數(shù)據(jù)的振幅與原音頻數(shù)據(jù)的振幅保持一致。
本發(fā)明數(shù)字電視節(jié)目同聲翻譯輸出方法及系統(tǒng),將緩存的電視節(jié)目數(shù)據(jù)流進(jìn)行視頻、音頻和字幕三者的分離,然后對(duì)音頻數(shù)據(jù)進(jìn)行分段、音色識(shí)別和翻譯處理等處理,并利用字幕數(shù)據(jù)和時(shí)間戳進(jìn)行修正和同步處理,完成將原始音頻數(shù)據(jù)同聲翻譯成用戶所需語言的音頻數(shù)據(jù),進(jìn)而播放給用戶,使得用戶能夠無需觀看字幕就能夠聽懂電視節(jié)目的音頻,給用戶觀看電視節(jié)目帶來了極大的便利,用戶不會(huì)因此錯(cuò)過電視節(jié)目的畫面內(nèi)容,大大提高了用戶的觀看體驗(yàn)。
附圖說明
圖1是一個(gè)實(shí)施例中的數(shù)字電視節(jié)目同聲翻譯輸出方法的流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市九洲電器有限公司,未經(jīng)深圳市九洲電器有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611253202.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點(diǎn)播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機(jī)頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨(dú)立于分配過程實(shí)現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- 使用逆空間濾波的數(shù)字圖像重建
- 數(shù)字版權(quán)管理交易系統(tǒng)
- 一種數(shù)字證書自動(dòng)申請(qǐng)方法和裝置及系統(tǒng)
- 用于數(shù)字記憶練習(xí)的數(shù)學(xué)教具
- 一種數(shù)字種類的確定方法及裝置
- 數(shù)字資產(chǎn)編碼方法
- 數(shù)字證書管理方法及設(shè)備
- 數(shù)字媒體水印處理方法、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 數(shù)字亞克力標(biāo)牌
- 一種基于區(qū)塊鏈的數(shù)字資產(chǎn)交易方法、裝置及存儲(chǔ)介質(zhì)





