[發(fā)明專利]視頻通話中語音處理系統(tǒng)及其方法在審
| 申請?zhí)枺?/td> | 201710093114.9 | 申請日: | 2017-02-21 |
| 公開(公告)號: | CN106713818A | 公開(公告)日: | 2017-05-24 |
| 發(fā)明(設計)人: | 陳天武 | 申請(專利權)人: | 福建江夏學院 |
| 主分類號: | H04N7/14 | 分類號: | H04N7/14 |
| 代理公司: | 福州元創(chuàng)專利商標代理有限公司35100 | 代理人: | 蔡學俊,薛金才 |
| 地址: | 350108 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 通話 語音 處理 系統(tǒng) 及其 方法 | ||
1.一種視頻通話中語音處理的系統(tǒng),其特征在于:包括硬件驅(qū)動與操作系統(tǒng)模塊、視頻通話中間件模塊、本地語音轉(zhuǎn)文字模塊、本地通話氛圍模塊、文字轉(zhuǎn)字幕存儲模塊、文字效果用戶設置模塊、通話氛圍用戶設置模塊及外部增強通話功能在線服務器;所述外部增強通話功能在線服務器包括在線語音轉(zhuǎn)文字模塊及在線通話氛圍模塊;在線語音轉(zhuǎn)文字模塊包括語音識別單元;所述視頻通話中間件模塊用于接收對方視頻通話的音視頻數(shù)據(jù),并將音視頻數(shù)據(jù)解復用,得到視頻數(shù)據(jù)和音頻數(shù)據(jù);本地語音轉(zhuǎn)文字模塊或在線語音轉(zhuǎn)文字模塊將音頻數(shù)據(jù),調(diào)用語音轉(zhuǎn)文件接口,得到用戶的文字內(nèi)容;本地通話氛圍模塊或在線通話氛圍模塊將通話整體氛圍渲染成圖像,并與視頻圖像合成后在終端渲染顯示。
2.一種視頻通話中語音處理方法,其特征在于:包括以下步驟:
S1:視頻通話終端通過基礎通信網(wǎng)互聯(lián)互通;提供一外部增強通話功能在線服務器;外部增強通話功能的在線服務器包括在線語音識別服務器及在線通話氛圍服務器;
S2:用戶通過視頻通話終端進行通話;視頻通話中間件模塊接收對方視頻通話的音視頻數(shù)據(jù),并將音視頻數(shù)據(jù)解復用,得到視頻數(shù)據(jù)和音頻數(shù)據(jù);通過終端的本地語音轉(zhuǎn)文字模塊或在線語音轉(zhuǎn)文字模塊的語音識別單元對對方的音頻數(shù)據(jù)進行語音識別,再轉(zhuǎn)換成文字存儲在文字轉(zhuǎn)字幕存儲模塊,并將識別的文字內(nèi)容疊加到終端的視頻畫面上進行顯示;
S3:調(diào)用終端的本地通話氛圍模塊或外部增強通話功能服務器的在線通話氛圍模塊;根據(jù)S2中識別的文字內(nèi)容,將通話整體氛圍渲染成圖像和文字效果,并與視頻圖像合成后在終端渲染顯示。
3.根據(jù)權利要求2所述的視頻通話中語音處理方法,其特征在于:用戶根據(jù)需求選擇是否調(diào)用本地通話氛圍模塊或外部增強通話功能服務器的在線通話氛圍模塊。
4.根據(jù)權利要求2所述的視頻通話中語音處理方法,其特征在于:預先存儲有多種文字疊加在視頻畫面的模板,由用戶進行選擇。
5.根據(jù)權利要求2所述的視頻通話中語音處理方法,其特征在于:視頻通話終端間的數(shù)據(jù)通信過程包含用戶認證過程,視頻通話終端和外部增強通話功能在線服務器間的數(shù)據(jù)通信過程包含用戶認證過程。
6.根據(jù)權利要求2所述的視頻通話中語音處理方法,其特征在于:還包括S4:當S3中調(diào)取外部增強通話功能服務器的在線通話氛圍模塊;終端將音視頻數(shù)據(jù)傳輸給外部增強通話功能在線服務器,在線服務器處理后,得到文字數(shù)據(jù)和氛圍數(shù)據(jù),連同終端的音視頻數(shù)據(jù)一并傳輸給對方。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建江夏學院,未經(jīng)福建江夏學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710093114.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





