[發(fā)明專利]一種音頻會議的音質(zhì)測試方法有效

申請?zhí)枺?/td>	201611004655.1	申請日：	2016-11-15
公開（公告）號：	CN106782610B	公開（公告）日：	2019-09-20
發(fā)明（設(shè)計）人：	洪劍平;陳錦輝	申請（專利權(quán)）人：	福建星網(wǎng)智慧科技股份有限公司
主分類號：	G10L25/60	分類號：	G10L25/60
代理公司：	福州市鼓樓區(qū)京華專利事務(wù)所(普通合伙) 35212	代理人：	宋連梅
地址：	350000 福建省廈門市***	國省代碼：	福建;35
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種音頻會議音質(zhì) 測試方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明提供一種音頻會議的音質(zhì)測試方法，所述方法為：獲取參加音頻會議的各個成員對應(yīng)的源音頻；每個成員通過音頻系統(tǒng)基于源音頻構(gòu)造出與目標音頻相近的合成音頻，即每個成員扣除自身的源音頻后，將其他成員的源音頻進行混合后形成合成音頻，該合成音頻為每個成員自身對應(yīng)的合成音頻；每個成員將自身對應(yīng)的合成音頻與音頻會議服務(wù)器發(fā)送的目標音頻數(shù)據(jù)使用ITU?T P.862建議書進行PESQ計算獲得當(dāng)前的實時音質(zhì)，并將音質(zhì)的數(shù)值記錄下來，來完成音質(zhì)的測試。該方法測試簡單，且測試比較精確。

技術(shù)領(lǐng)域

本發(fā)明涉及通信設(shè)備技術(shù)領(lǐng)域，尤其涉及一種音頻會議的音質(zhì)測試方法。

背景技術(shù)

在現(xiàn)有的音質(zhì)測試模型中，最為常用的是PESQ(Perceptual evaluation ofspeech quality)即：主觀語音質(zhì)量評估的測試方法。該方法是ITU-T P.862建議書提供的客觀MOS(Mean Opinion Score，平均主觀意見分)值評價方法。使用PESQ的測試方法，必須有源音頻以及目標音頻。通過計算源音頻與目標音頻的PESQ，來判斷出音質(zhì)的前后差異，進而得出MOS值。MOS值就是當(dāng)前對應(yīng)音質(zhì)的量化結(jié)果。

在音頻會議中，每個成員加入同一個會議中，只能聽到非自己的音頻，也就是對于音頻會議來說，每個成員聽到的都是其余成員的混音結(jié)果。這也就造就每個成員聽到的音頻是特殊的。每個人都不一樣。

因為會議會將每個與會者的音頻進行合成，并且每個與會者聽到的都是其余與會者的混音結(jié)果，也就是每個人聽到的音頻都不盡相同。因此測試音頻會議的音質(zhì)可以很容易的獲取到每個與會者的源音頻，但是目標音頻已經(jīng)是被混合過的數(shù)據(jù)，一般情況下與源音頻已經(jīng)有很大的差異，因此不容易基于ITU-T P.862建議書進行PESQ的音質(zhì)評估，如果基于ITU-T P.862建議書進行音頻評估，音質(zhì)肯定是相對較差的。

針對以上的情況，可以很容易獲取到每個與會者的源音頻，但是比較難獲取到目標音頻，或者可以這么認為，容易獲取到目標音頻，但是源音頻并不能與目標音頻相對應(yīng)，因此就需要構(gòu)造能夠符合目標音頻的源音頻。

發(fā)明內(nèi)容

本發(fā)明要解決的技術(shù)問題，在于提供一種音頻會議的音質(zhì)測試方法，該方法測試簡單，且測試比較精確。

本發(fā)明是這樣實現(xiàn)的：一種音頻會議的音質(zhì)測試方法，所述方法為：

獲取參加音頻會議的各個成員對應(yīng)的源音頻；

每個成員通過音頻系統(tǒng)基于源音頻構(gòu)造出與目標音頻相近的合成音頻，即每個成員扣除自身的源音頻后，將其他成員的源音頻進行混合后形成合成音頻，該合成音頻為每個成員自身對應(yīng)的合成音頻；

每個成員將自身對應(yīng)的合成音頻與音頻會議服務(wù)器發(fā)送的目標音頻數(shù)據(jù)使用ITU-T P.862建議書進行PESQ計算獲得當(dāng)前的實時音質(zhì)，并將音質(zhì)的數(shù)值記錄下來，來完成音質(zhì)的測試。

進一步的，所述方法具體為：會議開始后，獲取參加音頻會議的各個成員對應(yīng)的源音頻；音頻會議服務(wù)器需要給每個成員本地合成做一個時間同步，告知本地合成需要從哪個時間點開始合成；告知后，本地合成開始根據(jù)每個成員的源音頻進行本地合成，此時服務(wù)器開始進行從本地源音頻發(fā)送過來的報文解析，并進行合成操作；當(dāng)合成到某個時間點，不需要給進行合成操作的成員做通知做其它操作；但必須給其它成員的本地合成做通知，其它成員本地合成在接收到進行合成操作的成員被靜音的操作后，必須及時的做出響應(yīng)，將進行合成操作成員的源數(shù)據(jù)替換成靜音音頻。

進一步的，由于音頻會議服務(wù)器到本地還會有網(wǎng)絡(luò)延時，因此通知數(shù)據(jù)中，也要告知進行合成操作的成員在哪個時段被靜音，然后本地合成模型將進行合成操作的成員開始靜音時段的數(shù)據(jù)進行同步操作處理。

進一步的，音頻會議服務(wù)器將合成的RTP報文發(fā)回來后，本地接收音頻會議服務(wù)器發(fā)回的RTP報文數(shù)據(jù)，該RTP報文數(shù)據(jù)即為音頻會議服務(wù)器發(fā)送的目標音頻數(shù)據(jù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建星網(wǎng)智慧科技股份有限公司，未經(jīng)福建星網(wǎng)智慧科技股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201611004655.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種鋼筋網(wǎng)焊接生產(chǎn)線
下一篇：一種適用于混響環(huán)境的漢語語音清晰度評測算法

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】