[發(fā)明專利]基于自動選擇語音解碼播放格式的語音處理方法有效
| 申請?zhí)枺?/td> | 202110454832.0 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN112863526B | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設(shè)計)人: | 王霞;陳永慈;時東各 | 申請(專利權(quán))人: | 北京京安佳新技術(shù)有限公司 |
| 主分類號: | G10L19/16 | 分類號: | G10L19/16;G10L19/24;G10L19/002;H04L29/08 |
| 代理公司: | 北京睿博行遠知識產(chǎn)權(quán)代理有限公司 11297 | 代理人: | 申超平 |
| 地址: | 100000 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 自動 選擇 語音 解碼 播放 格式 處理 方法 | ||
1.一種基于自動選擇語音解碼播放格式的語音處理方法,其特征在于,包括:獲取待播放語音,所述待播放語音采用幀格式存儲至云端;
從云端調(diào)取所述待播放語音,查找所述待播放語音的文件頭和語音幀;
讀取所述文件頭和語音幀中的信息,并根據(jù)所述文件頭和語音幀中的信息獲取播放所述待播放語音的播放格式;
以播放格式播放所述待播放語音;
獲取待播放語音,所述待播放語音采用幀格式存儲至云端包括:
獲取所述待播放語音的字節(jié)長度l;
處理器內(nèi)設(shè)置有第一字節(jié)長度l1、第二字節(jié)長度l2和第三字節(jié)長度l3,根據(jù)待播放語音的實際長度選擇云端的數(shù)據(jù)處理速率;
若待播放語音的字節(jié)長度l≤第一字節(jié)長度l1,則選擇第一數(shù)據(jù)處理速率;
若第二字節(jié)長度l2≥待播放語音的字節(jié)長度l第一字節(jié)長度l1,則選擇第二數(shù)據(jù)處理速率;
若第三字節(jié)長度l3≥待播放語音的字節(jié)長度l第二字節(jié)長度l2,則選擇第三數(shù)據(jù)處理速率;
若待播放語音的字節(jié)長度l第三字節(jié)長度l3,則選擇第四數(shù)據(jù)處理速率;
所述讀取所述文件頭和語音幀中的信息,并根據(jù)所述文件頭和語音幀中的信息獲取播放所述待播放語音的播放格式包括:
根據(jù)所述文件頭中的信息獲取所述待播放語音中包含n段語音格式,各段分別為第一段n1,…,第n段,并確定每段語音格式的字節(jié)長度z;
第一段n1的字節(jié)長度為z1,第二段的字節(jié)長度為z2,第三字段的字節(jié)長度為z3,第n段的字節(jié)長度為zn,z1-zn的長度可以相等,可以不等;比較z1-zn的字節(jié)長度,選擇其中字節(jié)長度最長的zi和次長的字節(jié)長度zj,確定在當(dāng)前網(wǎng)絡(luò)下以zi的語音格式播放語音的流暢性fi和以zj的語音格式播放語音的流暢性fj;
若fifj,則采用zi的語音格式播放該待播放語音;
若fifj,則采用zj的語音格式播放該待播放語音;
若fi=fj,則采用zi的語音格式或zj的語音格式播放該待播放語音。
2.根據(jù)權(quán)利要求1所述的基于自動選擇語音解碼播放格式的語音處理方法,其特征在于,
確定在當(dāng)前網(wǎng)絡(luò)下以任意的語音格式播放語音的流暢性f包括:
確定當(dāng)下網(wǎng)絡(luò)情況,設(shè)置有第一網(wǎng)絡(luò)狀況,表示網(wǎng)絡(luò)狀況好,傳輸速率高,賦值為1,若當(dāng)下的網(wǎng)絡(luò)狀況一般,傳輸速率中等,則屬于第二網(wǎng)絡(luò)狀況,賦值為2,若網(wǎng)絡(luò)狀況差,傳輸速率低,則屬于第三網(wǎng)絡(luò)狀況,賦值為3,流暢性f的表達式為f=t×d0i,其中t表示網(wǎng)絡(luò)狀況的賦值,d0i表示第i語音格式對應(yīng)的字節(jié)長度增加量。
3.根據(jù)權(quán)利要求2所述的基于自動選擇語音解碼播放格式的語音處理方法,其特征在于,在從云端調(diào)取所述待播放語音,查找所述待播放語音的文件頭和語音幀之前,云端以標(biāo)準(zhǔn)響應(yīng)速度v0響應(yīng)調(diào)取指令;
當(dāng)所述云端以標(biāo)準(zhǔn)響應(yīng)速度v0響應(yīng)調(diào)取指令時,基于實際網(wǎng)絡(luò)狀況對響應(yīng)速度進行修正,中控單元內(nèi)設(shè)置有第一修正系數(shù)k1、第二修正系數(shù)k2和第三修正系數(shù)k3,且k1k2k3≥1:若網(wǎng)絡(luò)側(cè)的網(wǎng)絡(luò)狀況屬于第一網(wǎng)絡(luò)狀況,則采用第一修正系數(shù)對響應(yīng)速度進行調(diào)整,將云端的響應(yīng)速度調(diào)整為v10′= v0×k1;
若網(wǎng)絡(luò)側(cè)的網(wǎng)絡(luò)狀況屬于第二網(wǎng)絡(luò)狀況,則將采用第二修正系數(shù)對響應(yīng)速度進行調(diào)整,云端的響應(yīng)速度調(diào)整為v20′= v0×k2;
若網(wǎng)絡(luò)側(cè)的網(wǎng)絡(luò)狀況屬于第三網(wǎng)絡(luò)狀況,則采用第三修正系數(shù)對響應(yīng)速度進行調(diào)整,云端的響應(yīng)速度調(diào)整為v30′= v0×k3。
4.根據(jù)權(quán)利要求3所述的基于自動選擇語音解碼播放格式的語音處理方法,其特征在于,若n段字節(jié)中的字節(jié)長度排序為z1z2… zn,則所述第一修正系數(shù)k1= z1/zn+(z4+z5+…zn)/(z1+z2+…zn);
所述第二修正系數(shù)k2= z2/zn+(z4+z5+…zn)/(z1+z2+…zn);
所述第三修正系數(shù)k3= z3/zn+(z4+z5+…zn)/(z1+z2+…zn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京安佳新技術(shù)有限公司,未經(jīng)北京京安佳新技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110454832.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





