[發(fā)明專利]語音處理方法、裝置以及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202011254361.0 | 申請(qǐng)日: | 2020-11-11 |
| 公開(公告)號(hào): | CN112489665A | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計(jì))人: | 秦永紅;李勇強(qiáng) | 申請(qǐng)(專利權(quán))人: | 北京融訊科創(chuàng)技術(shù)有限公司 |
| 主分類號(hào): | G10L19/005 | 分類號(hào): | G10L19/005;G10L19/008;H04L1/00 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 潘登 |
| 地址: | 100038 北京市大興區(qū)北京經(jīng)濟(jì)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 處理 方法 裝置 以及 電子設(shè)備 | ||
本發(fā)明實(shí)施例公開了一種語音處理方法、裝置以及電子設(shè)備,該方法包括:當(dāng)檢測(cè)到語音幀丟包時(shí),確定語音幀為當(dāng)前語音幀并獲取與當(dāng)前語音幀相鄰的正確語音幀的冗余信息;根據(jù)冗余信息對(duì)當(dāng)前語音幀進(jìn)行解碼;其中,冗余信息包括處于與正確語音幀的傳輸時(shí)間相鄰的預(yù)設(shè)傳輸時(shí)長(zhǎng)內(nèi)的激勵(lì)脈沖參數(shù)以及編碼參數(shù)。本實(shí)施例的技術(shù)方案,解決了語音幀重傳和進(jìn)行前向糾錯(cuò)編碼傳輸時(shí)易造成的帶寬消耗大以及網(wǎng)絡(luò)擁塞的技術(shù)問題,實(shí)現(xiàn)了在部分語音幀中添加少量冗余信息,以增強(qiáng)丟包后的數(shù)據(jù)恢復(fù),同時(shí)達(dá)到節(jié)省帶寬,避免網(wǎng)絡(luò)擁塞,并提高了語音質(zhì)量的技術(shù)效果。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及音頻處理技術(shù),尤其涉及一種語音處理方法、裝置以及電子設(shè)備。
背景技術(shù)
在實(shí)際的語音通話中,通話質(zhì)量主要受網(wǎng)絡(luò)丟包影響。由于傳輸網(wǎng)絡(luò)的不穩(wěn)定性會(huì)導(dǎo)致語音信息傳輸過程出現(xiàn)丟包現(xiàn)象,造成聲音的卡頓和不連續(xù)。
目前,為了進(jìn)行丟包后的數(shù)據(jù)恢復(fù),可以使用重傳的方式,但是該方式需要額外消耗帶寬,容易引發(fā)網(wǎng)絡(luò)擁塞,而且一旦碰上連續(xù)丟包,也很難進(jìn)行恢復(fù)。另外,在實(shí)時(shí)語音通訊中,當(dāng)超過一定時(shí)延,即使重傳到達(dá),也會(huì)被丟棄。使用前向糾錯(cuò)的方式,不必重傳數(shù)據(jù),但是編解碼時(shí)增加了計(jì)算的開銷和復(fù)雜性,用處理能力和帶寬來換取可靠性和較小的回復(fù)延遲,在丟包率較高的情況下,性能明顯下降。在接收端采用差錯(cuò)掩蓋技術(shù)容易實(shí)現(xiàn),但是掩蓋性能較差,語音質(zhì)量較差。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種語音處理方法、裝置以及電子設(shè)備,以實(shí)現(xiàn)根據(jù)丟包語音幀的相鄰的正確語音幀對(duì)丟包語音幀進(jìn)行解碼,進(jìn)而提高語音質(zhì)量。
第一方面,本發(fā)明實(shí)施例提供了一種語音處理方法,包括:
當(dāng)檢測(cè)到語音幀丟包時(shí),確定所述語音幀為當(dāng)前語音幀并獲取與所述當(dāng)前語音幀相鄰的正確語音幀的冗余信息;
根據(jù)所述冗余信息對(duì)所述當(dāng)前語音幀進(jìn)行解碼;
其中,所述冗余信息包括處于與所述正確語音幀的傳輸時(shí)間相鄰的預(yù)設(shè)傳輸時(shí)長(zhǎng)內(nèi)的激勵(lì)脈沖參數(shù)以及編碼參數(shù)。
第二方面,本發(fā)明實(shí)施例還提供了一種語音處理裝置,包括:
冗余信息確定模塊,用于當(dāng)檢測(cè)到語音幀丟包時(shí),確定所述語音幀為當(dāng)前語音幀并確定獲取與所述當(dāng)前語音幀相鄰的正確語音幀的冗余信息;
語音解碼模塊,用于根據(jù)所述冗余信息對(duì)所述當(dāng)前語音幀進(jìn)行解碼;
其中,所述冗余信息包括處于與所述正確語音幀的傳輸時(shí)間相鄰的預(yù)設(shè)傳輸時(shí)長(zhǎng)內(nèi)的激勵(lì)脈沖參數(shù)以及編碼參數(shù)。
第三方面,本發(fā)明實(shí)施例還提供了一種電子設(shè)備,所述電子設(shè)備包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如本發(fā)明實(shí)施例任一所述的語音傳輸方法。
第四方面,本發(fā)明實(shí)施例還提供了一種包含計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令在由計(jì)算機(jī)處理器執(zhí)行時(shí)用于執(zhí)行如本發(fā)明實(shí)施例任一所述的語音傳輸方法。
本發(fā)明實(shí)施例的技術(shù)方案,通過檢測(cè)到語音幀丟包時(shí),將該語音幀作為當(dāng)前語音幀并獲取與當(dāng)前語音幀相鄰的正確語音幀的冗余信息,根據(jù)冗余信息對(duì)當(dāng)前語音幀進(jìn)行解碼,解決了語音幀重傳和進(jìn)行前向糾錯(cuò)編碼傳輸時(shí)易造成的帶寬消耗大以及網(wǎng)絡(luò)擁塞的技術(shù)問題,實(shí)現(xiàn)了在部分語音幀中添加少量冗余信息,以增強(qiáng)丟包后的數(shù)據(jù)恢復(fù),同時(shí)達(dá)到節(jié)省帶寬,避免網(wǎng)絡(luò)擁塞,并提高了語音質(zhì)量的技術(shù)效果。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京融訊科創(chuàng)技術(shù)有限公司,未經(jīng)北京融訊科創(chuàng)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011254361.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





