[發(fā)明專利]語(yǔ)音傳輸方法、系統(tǒng)、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 202010104793.7 | 申請(qǐng)日: | 2020-02-20 |
| 公開(kāi)(公告)號(hào): | CN112820306B | 公開(kāi)(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計(jì))人: | 梁俊斌 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G10L19/16 | 分類號(hào): | G10L19/16;G10L19/008 |
| 代理公司: | 華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 董慧;李文淵 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 傳輸 方法 系統(tǒng) 裝置 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) 設(shè)備 | ||
本申請(qǐng)涉及一種語(yǔ)音傳輸方法、系統(tǒng)、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和設(shè)備,所述方法包括:獲取語(yǔ)音編碼碼流中的當(dāng)前編碼數(shù)據(jù);通過(guò)基于機(jī)器學(xué)習(xí)的丟包恢復(fù)能力預(yù)測(cè)模型,根據(jù)當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的第一語(yǔ)音編碼特征參數(shù)以及當(dāng)前編碼數(shù)據(jù)的在前編碼數(shù)據(jù)對(duì)應(yīng)的第二語(yǔ)音編碼特征參數(shù),獲得當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的丟包恢復(fù)能力;根據(jù)丟包恢復(fù)能力判決是否需要進(jìn)行冗余編碼處理;若是,則根據(jù)當(dāng)前編碼數(shù)據(jù)進(jìn)行冗余編碼生成相應(yīng)的冗余包后,再將當(dāng)前編碼數(shù)據(jù)及冗余包傳輸至接收端;若否,則直接將當(dāng)前編碼數(shù)據(jù)傳輸至接收端。本申請(qǐng)?zhí)峁┑姆桨缚梢杂行嵘W(wǎng)絡(luò)帶寬的利用率,同時(shí)也能保證傳輸網(wǎng)絡(luò)的抗丟包能力。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種語(yǔ)音傳輸方法、系統(tǒng)、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備。
背景技術(shù)
互聯(lián)網(wǎng)是非可靠的傳輸網(wǎng)絡(luò),基于互聯(lián)網(wǎng)的語(yǔ)音傳輸面對(duì)的主要問(wèn)題就是抗丟包問(wèn)題,由于傳輸網(wǎng)絡(luò)的不穩(wěn)定性,傳輸過(guò)程會(huì)出現(xiàn)丟包現(xiàn)象。為了抵抗網(wǎng)絡(luò)丟包,通常會(huì)采用FEC(Forward?Error?Correction,前向糾錯(cuò))冗余編碼這種信道編碼算法生成冗余包,將冗余包與數(shù)據(jù)包一起發(fā)送到接收端,接收端收到后通過(guò)冗余包和原始包來(lái)恢復(fù)出丟失的數(shù)據(jù)包,從而起到抗丟包的效果。
然而,F(xiàn)EC冗余編碼依靠生成冗余包來(lái)抵抗傳輸網(wǎng)絡(luò)的丟包問(wèn)題,勢(shì)必帶來(lái)帶寬成倍數(shù)的增大,消耗過(guò)多網(wǎng)絡(luò)帶寬資源,抗丟包能力越強(qiáng)則消耗網(wǎng)絡(luò)帶寬越多,尤其對(duì)于帶寬受限場(chǎng)景下容易出現(xiàn)網(wǎng)絡(luò)擁塞等問(wèn)題反而會(huì)導(dǎo)致丟包更多。
發(fā)明內(nèi)容
基于此,有必要針對(duì)現(xiàn)有技術(shù)中對(duì)數(shù)據(jù)包進(jìn)行冗余編碼消耗更多網(wǎng)絡(luò)帶寬資源可能造成丟包更多的技術(shù)問(wèn)題,提供一種語(yǔ)音傳輸方法、裝置、系統(tǒng)、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備。
一種語(yǔ)音傳輸方法,包括:
獲取語(yǔ)音編碼碼流中的當(dāng)前編碼數(shù)據(jù);
通過(guò)基于機(jī)器學(xué)習(xí)的丟包恢復(fù)能力預(yù)測(cè)模型,根據(jù)當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的第一語(yǔ)音編碼特征參數(shù)以及所述當(dāng)前編碼數(shù)據(jù)的在前編碼數(shù)據(jù)對(duì)應(yīng)的第二語(yǔ)音編碼特征參數(shù),獲得所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的丟包恢復(fù)能力;
根據(jù)所述丟包恢復(fù)能力判決是否需要進(jìn)行冗余編碼處理;
若是,則根據(jù)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行冗余編碼生成相應(yīng)的冗余包后,再將所述當(dāng)前編碼數(shù)據(jù)及所述冗余包傳輸至接收端;
若否,則直接將所述當(dāng)前編碼數(shù)據(jù)傳輸至接收端。
一種語(yǔ)音傳輸系統(tǒng),包括發(fā)送端和接收端,其中:
所述發(fā)送端用于獲取語(yǔ)音編碼碼流中的當(dāng)前編碼數(shù)據(jù),通過(guò)基于機(jī)器學(xué)習(xí)的丟包恢復(fù)能力預(yù)測(cè)模型,根據(jù)所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的第一語(yǔ)音編碼特征參數(shù)以及所述當(dāng)前編碼數(shù)據(jù)的在前編碼數(shù)據(jù)對(duì)應(yīng)的第二語(yǔ)音編碼特征參數(shù),獲得所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的丟包恢復(fù)能力;
所述發(fā)送端還用于根據(jù)所述丟包恢復(fù)能力判決是否需要進(jìn)行冗余編碼處理;若是,則根據(jù)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行冗余編碼生成相應(yīng)的冗余包后,再將所述當(dāng)前編碼數(shù)據(jù)及所述冗余包傳輸至接收端;若否,則直接將所述當(dāng)前編碼數(shù)據(jù)傳輸至接收端;
所述接收端用于接收到所述當(dāng)前編碼數(shù)據(jù)時(shí),則直接對(duì)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行語(yǔ)音解碼,獲得所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音信號(hào);還用于當(dāng)未接收到所述當(dāng)前編碼數(shù)據(jù)、且接收到所述冗余包時(shí),則通過(guò)所述接收端基于所述冗余包進(jìn)行冗余解碼處理,得到所述當(dāng)前編碼數(shù)據(jù)后再對(duì)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行語(yǔ)音解碼,獲得所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音信號(hào);
所述接收端還用于未接收到所述當(dāng)前編碼數(shù)據(jù)及所述冗余包時(shí),則通過(guò)所述接收端對(duì)所述當(dāng)前編碼數(shù)據(jù)進(jìn)行丟包恢復(fù)處理,獲得對(duì)應(yīng)于所述當(dāng)前編碼數(shù)據(jù)的恢復(fù)包,對(duì)所述恢復(fù)包進(jìn)行語(yǔ)音解碼,獲得所述當(dāng)前編碼數(shù)據(jù)對(duì)應(yīng)的語(yǔ)音信號(hào)。
一種語(yǔ)音傳輸裝置,所述裝置包括:
獲取模塊,用于獲取語(yǔ)音編碼碼流中的當(dāng)前編碼數(shù)據(jù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010104793.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





