[發明專利]基于自動選擇語音解碼播放格式的語音處理方法有效

申請號：	202110454832.0	申請日：	2021-04-26
公開（公告）號：	CN112863526B	公開（公告）日：	2021-07-16
發明（設計）人：	王霞;陳永慈;時東各	申請（專利權）人：	北京京安佳新技術有限公司
主分類號：	G10L19/16	分類號：	G10L19/16;G10L19/24;G10L19/002;H04L29/08
代理公司：	北京睿博行遠知識產權代理有限公司 11297	代理人：	申超平
地址：	100000 北京市海淀區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于自動選擇語音解碼播放格式處理方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明涉及一種基于自動選擇語音解碼播放格式的語音處理方法，該方法包括：獲取待播放語音，所述待播放語音采用幀格式存儲至云端；從云端調取所述待播放語音，查找所述待播放語音的文件頭和語音幀；讀取所述文件頭和語音幀中的信息，并根據所述文件頭和語音幀中的信息獲取播放所述待播放語音的播放格式；以播放格式播放所述待播放語音。通過在語音解碼后根據語音中的文件頭和語音幀中的信息獲取播放格式，并根據對應的播放格式播放語音，本發明實施例中的語音播放不間斷播放，提高語音播放的連續性，無需對語音進行分段處理，優化用戶播放體驗。

技術領域

本發明涉及數據處理技術領域，尤其涉及一種基于自動選擇語音解碼播放格式的語音處理方法。

背景技術

在移動網絡如4G網絡或5G網絡中，一段完整的語音對話，一般會包含兩種或者兩種以上格式的語音，現有的語音處理方式是：將一段完整的語音對話進行切割，切開為多段不同格式的語音文件，然后按照順序先后分段播放，且每段語音文件進行播放時按照該語音文件的格式進行播放。

但是，在對語音進行播放時，由于其切割為多段不同格式的語音文件，因此在對語音文件進行順序播放過程中，需要對播放格式進行切換，因此在對播放格式進行切換過程中會影響語音播放的流暢性。

發明內容

為此，本發明提供一種基于自動選擇語音解碼播放格式的語音處理方法，可以解決在語音播放過程中切換格式導致的播放不流暢的問題。

為實現上述目的，本發明提供一種基于自動選擇語音解碼播放格式的語音處理方法，包括：

獲取待播放語音，所述待播放語音采用幀格式存儲至云端；

從云端調取所述待播放語音，查找所述待播放語音的文件頭和語音幀；

讀取所述文件頭和語音幀中的信息，并根據所述文件頭和語音幀中的信息獲取播放所述待播放語音的播放格式；

以播放格式播放所述待播放語音；

獲取待播放語音，所述待播放語音采用幀格式存儲至云端包括：

獲取所述待播放語音的字節長度l；

處理器內設置有第一字節長度l1、第二字節長度l2和第三字節長度l3，根據待播放語音的實際長度選擇云端的數據處理速率；

若待播放語音的字節長度l≤第一字節長度l1，則選擇第一數據處理速率；

若第二字節長度l2≥待播放語音的字節長度l第一字節長度l1，則選擇第二數據處理速率；

若第三字節長度l3≥待播放語音的字節長度l第二字節長度l2，則選擇第三數據處理速率；

若待播放語音的字節長度l第三字節長度l3，則選擇第四數據處理速率。

進一步地，所述讀取所述文件頭和語音幀中的信息，并根據所述文件頭和語音幀中的信息獲取播放所述待播放語音的播放格式包括：

根據所述文件頭中的信息獲取所述待播放語音中包含n段語音格式，割斷分別為第一段n1，并確定每段語音格式的字節長度z；

第一段n1的字節長度為z1，第二段的字節長度為z2，第三字段的字節長度為z3，第n段的字節長度為zn，z1-zn的長度可以相等，可以不等；比較z1-zn的字節長度，選擇其中字節長度最長的zi和次長的字節長度zj，確定在當前網絡下以zi的語音格式播放語音的流暢性fi和以zj的語音格式播放語音的流暢性fj；

若fifj，則采用zi的語音格式播放該待播放語音；

若fifj，則采用zj的語音格式播放該待播放語音；

若fi=fj，則采用zi的語音格式或zj的語音格式播放該待播放語音。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京京安佳新技術有限公司，未經北京京安佳新技術有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110454832.0/2.html，轉載請聲明來源鉆瓜專利網。