[發(fā)明專利]一種實(shí)現(xiàn)丟包隱藏的方法和裝置有效
| 申請?zhí)枺?/td> | 200710126165.3 | 申請日: | 2007-06-14 |
| 公開(公告)號: | CN101325631A | 公開(公告)日: | 2008-12-17 |
| 發(fā)明(設(shè)計)人: | 詹五洲;王東琦 | 申請(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號: | H04M7/00 | 分類號: | H04M7/00;H04L12/56;H04L29/06 |
| 代理公司: | 北京德琦知識產(chǎn)權(quán)代理有限公司 | 代理人: | 宋志強(qiáng);麻海明 |
| 地址: | 518129廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 實(shí)現(xiàn) 隱藏 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,尤指一種估計基音周期的方法和裝置、一種對基音周期進(jìn)行微調(diào)的方法和裝置以及實(shí)現(xiàn)丟包隱藏的方法和裝置。
背景技術(shù)
最初,IP網(wǎng)絡(luò)是為傳輸包含較大的包且不需要實(shí)時可靠傳送的數(shù)據(jù)流而設(shè)計的。而現(xiàn)在IP網(wǎng)絡(luò)中也傳輸語音數(shù)據(jù)。語音的傳輸需要實(shí)時可靠地傳送較小的語音包,當(dāng)一個語音包在傳輸過程中被丟棄時,通常沒有時間重新傳送該被丟棄的包。另外,當(dāng)一個語音包經(jīng)過了一段較長的路由而在需要播放時不能及時到達(dá)時,這個包已經(jīng)失去了存在的意義。因此在基于IP網(wǎng)絡(luò)協(xié)議的語音(VoIP,Voice?over?Internet?Protocol)系統(tǒng)中,語音包不能及時到達(dá)或不能到達(dá)時,都被認(rèn)為該語音包丟失了。
網(wǎng)絡(luò)傳輸過程中的丟包是在網(wǎng)絡(luò)傳輸語音數(shù)據(jù)時服務(wù)質(zhì)量下降的主要原因。而丟包隱藏技術(shù)是指通過合成的數(shù)據(jù)包補(bǔ)償丟失的包,來減小傳輸過程中的丟包對語音質(zhì)量的影響。如果沒有有效的語音丟包隱藏技術(shù),即使是設(shè)計和管理得最好的IP網(wǎng)絡(luò)也不能提供長話級品質(zhì)的通信。而設(shè)計良好的解決丟包問題的技術(shù),能很大程度上提高語音傳輸?shù)馁|(zhì)量。因此在現(xiàn)有技術(shù)中,不同的機(jī)制被用來隱藏由于丟包引起的影響。例如G.711協(xié)議的附錄1中記錄了以基音波形替代為基礎(chǔ)的丟包隱藏方法。
基音波形替代是一種基于收端的處理技術(shù),它根據(jù)語音的特點(diǎn)對丟失的數(shù)據(jù)幀進(jìn)行補(bǔ)償。下面介紹基音波形替代技術(shù)的原理、實(shí)現(xiàn)過程以及存在的缺點(diǎn)。
在語音信號中,一般清音從波形上看是雜亂無章的,而濁音在波形上則表現(xiàn)出周期性?;舨ㄐ翁娲闹饕硎牵菏紫?,利用丟失幀前一幀的信息,即波形缺口位置的前一幀的信息來估計出基音周期P,然后,用缺口位置之前的,長度為P的一段波形來補(bǔ)償波形的缺口。圖1是現(xiàn)有技術(shù)中利用基音波形補(bǔ)償丟失幀的示意圖。如圖1所示,幀2為丟失的音頻幀,幀長為L,幀1是幀2之前的音頻幀,幀3是幀2之后的音頻幀,且?guī)?和幀2都是完好的數(shù)據(jù)幀。假定已經(jīng)檢測出丟失幀前一幀,即幀2對應(yīng)的基音周期為P,在圖1中用區(qū)間1表示,那么根據(jù)濁音的周期性特點(diǎn),就可以把丟失幀的前一幀的最后一個基音周期的數(shù)據(jù),也就是區(qū)間1對應(yīng)的數(shù)據(jù)復(fù)制到丟失幀,以重建丟失幀2的信號。如果一個基音周期的數(shù)據(jù)不足以把丟失幀的空缺填滿,即基音周期P<丟失幀的幀長L,則重復(fù)復(fù)制區(qū)間1的數(shù)據(jù)到丟失幀的空缺進(jìn)行填充。例如在圖1中,L=2P,因此在復(fù)制區(qū)間1中的數(shù)據(jù)到區(qū)間2之后,還要再次復(fù)制區(qū)間1中的數(shù)據(jù)到區(qū)間3,即需要兩個基音周期才能填滿丟失幀。
在現(xiàn)有技術(shù)中一般使用自相關(guān)分析的方法來獲得基音波形替代方法中所使用的基音周期P。自相關(guān)分析是一種常用的語音時域波形分析方法,由相關(guān)函數(shù)來定義。相關(guān)函數(shù)可用來測定信號間的時域相似性,當(dāng)進(jìn)行相關(guān)的兩個信號完全不同時,相關(guān)函數(shù)的值接近于零;當(dāng)進(jìn)行相關(guān)的兩個信號的波形相同時,則會在超前或滯后處出現(xiàn)峰值。因此,自相關(guān)函數(shù)可用于研究信號本身,如波形的同步性、周期性等等。
圖2是現(xiàn)有技術(shù)中利用自相關(guān)分析來計算基音周期的方法的示意圖。在圖2中,長度為35ms的語音數(shù)據(jù)是歷史緩沖區(qū)(HB)中的一段數(shù)據(jù),即丟失幀之前的一段數(shù)據(jù)。TW是模版窗,該窗的尾部與HB中數(shù)據(jù)的尾部對齊,R對應(yīng)TW在HB中的起始位置。由于最大可能基音周期為15ms,因此通常取TW的長度W為20ms。SW是滑動窗,其窗長與模版窗TW的長度相同,也為20ms,TW的位置保持不變,而SW的起始位置L從HB的起始位置1點(diǎn)開始滑動到Q點(diǎn),從HB的1點(diǎn)到Q點(diǎn)的長度等于最大可能基音周期減去最小可能基音周期。在SW的滑動過程中計算SW中的采樣點(diǎn)和TW中的采樣點(diǎn)的自相關(guān)值,以搜索最佳匹配點(diǎn),在最佳匹配點(diǎn)處SW中的采樣點(diǎn)信號與TW中的采樣點(diǎn)信號的自相關(guān)值最大。則最佳匹配點(diǎn)和TW的起始位置R之間的距離P即為所估計的基音周期。
在上述過程中,用x(i)表示HB中的第i個采樣點(diǎn),且HB中采樣點(diǎn)個數(shù),即35ms數(shù)據(jù)中的采樣點(diǎn)個數(shù)為LEN,SW和TW中采樣點(diǎn)個數(shù),即20ms數(shù)據(jù)中的采樣點(diǎn)個數(shù)為W,則SW中的采樣點(diǎn)信號與TW中的采樣點(diǎn)信號的相關(guān)函數(shù)CR如公式(1)所示:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710126165.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 互動業(yè)務(wù)終端、實(shí)現(xiàn)系統(tǒng)及實(shí)現(xiàn)方法
- 街景地圖的實(shí)現(xiàn)方法和實(shí)現(xiàn)系統(tǒng)
- 游戲?qū)崿F(xiàn)系統(tǒng)和游戲?qū)崿F(xiàn)方法
- 圖像實(shí)現(xiàn)裝置及其圖像實(shí)現(xiàn)方法
- 增強(qiáng)現(xiàn)實(shí)的實(shí)現(xiàn)方法以及實(shí)現(xiàn)裝置
- 軟件架構(gòu)的實(shí)現(xiàn)方法和實(shí)現(xiàn)平臺
- 數(shù)值預(yù)報的實(shí)現(xiàn)方法及實(shí)現(xiàn)系統(tǒng)
- 空調(diào)及其冬眠控制模式實(shí)現(xiàn)方法和實(shí)現(xiàn)裝置以及實(shí)現(xiàn)系統(tǒng)
- 空調(diào)及其睡眠控制模式實(shí)現(xiàn)方法和實(shí)現(xiàn)裝置以及實(shí)現(xiàn)系統(tǒng)
- 輸入設(shè)備實(shí)現(xiàn)方法及其實(shí)現(xiàn)裝置





