[發明專利]視頻通話中語音處理系統及其方法在審
| 申請號: | 201710093114.9 | 申請日: | 2017-02-21 |
| 公開(公告)號: | CN106713818A | 公開(公告)日: | 2017-05-24 |
| 發明(設計)人: | 陳天武 | 申請(專利權)人: | 福建江夏學院 |
| 主分類號: | H04N7/14 | 分類號: | H04N7/14 |
| 代理公司: | 福州元創專利商標代理有限公司35100 | 代理人: | 蔡學俊,薛金才 |
| 地址: | 350108 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 通話 語音 處理 系統 及其 方法 | ||
技術領域
本發明涉及一種視頻通話中語音處理系統及方法。
背景技術
隨著技術的進步,人與人的遠程溝通方式從書信,電報,語音電話發展到視頻電話。視頻電話需要同時傳輸視頻數據和音頻數據,雖然音視頻數據均有壓縮,但是其數據量仍舊比純語音通信的多1-2個數量級。視頻通話對基礎網絡的要求,對終端的硬件配置均有大幅提高。
視頻通話就是音頻和視頻同時傳送,但是技術進步,能讓視頻通話承載更多的內容,改進視頻通話的用戶體驗,增加用戶的粘性。
發明內容
本發明的目的是提供一種視頻通話中語音處理的方法和系統,用于給視頻通話增加一些特性,增加視頻通話的趣味性,增加視頻通話功能的用戶粘性。
本發明采用以下技術方案實現:
一種視頻通話中語音處理的系統,其特征在于:包括硬件驅動與操作系統模塊、視頻通話中間件模塊、本地語音轉文字模塊、本地通話氛圍模塊、文字轉字幕存儲模塊、文字效果用戶設置模塊、通話氛圍用戶設置模塊及外部增強通話功能在線服務器;所述外部增強通話功能在線服務器包括在線語音轉文字模塊及在線通話氛圍模塊;在線語音轉文字模塊包括語音識別單元;所述視頻通話中間件模塊用于接收對方視頻通話的音視頻數據,并將音視頻數據解復用,得到視頻數據和音頻數據;本地語音轉文字模塊或在線語音轉文字模塊將音頻數據,調用語音轉文件接口,得到用戶的文字內容;本地通話氛圍模塊或在線通話氛圍模塊將通話整體氛圍渲染成圖像,并與視頻圖像合成后在終端渲染顯示。
本發明還提供一種視頻通話中語音處理方法,其特征在于:包括以下步驟:S1:視頻通話終端通過基礎通信網互聯互通;提供一外部增強通話功能在線服務器;外部增強通話功能在線服務器包括在線語音識別服務器及在線通話氛圍服務器;S2:用戶通過視頻通話終端進行通話;視頻通話中間件模塊接收對方視頻通話的音視頻數據,并將音視頻數據解復用,得到視頻數據和音頻數據;通過終端的本地語音轉文字模塊或在線語音轉文字模塊的語音識別單元對對方的音頻數據進行語音識別,再轉換成文字存儲在文字轉字幕存儲模塊,并將識別的文字內容疊加到終端的視頻畫面上進行顯示;S3:調用終端的本地通話氛圍模塊或外部增強通話功能服務器的在線通話氛圍模塊;根據S2中識別的文字內容,將通話整體氛圍渲染成圖像和文字效果,并與視頻圖像合成后在終端渲染顯示。
進一步的,用戶根據需求選擇是否調用本地或在線通話氛圍模塊。
進一步的,預先存儲有多種文字疊加在視頻畫面的模板,由用戶進行選擇。
進一步的,視頻通話終端間的數據通信過程包含用戶認證過程。
進一步的,還包括S4:當S3中調取外部增強通話功能服務器的在線通話氛圍模塊;終端將音視頻數據傳輸給外部增強通話功能在線服務器,在線服務器處理后,得到文字數據和氛圍數據,連同終端的音視頻數據一并傳輸給對方。
與現有技術相比,本發明具有以下優點:擴展了視頻通話的使用功能(語音轉文字),增加了功能的用戶粘性;增強了通話氛圍渲染功能(文字顯示的額外效果),同樣增加了功能的用戶粘性。
附圖說明
圖1為視頻通話中語音處理系統的總體結構圖。
圖2為視頻通話中語音處理系統的核心模塊框圖。
圖3為視頻通話中語音處理的操作序列圖。
具體實施方式
下面結合附圖和具體實施例對本發明做進一步解釋說明。
如圖1所示,視頻通話中語音處理系統的總體結構圖。視頻通話終端通過基礎通信網(互聯網等)互聯互通。視頻通話包含外部增強通話功能的在線服務器,如:在線語音識別服務器,在線通話氛圍服務器。服務器功能的劃分是功能邏輯上劃分,并非從物理邏輯上劃分,即在線語音視頻服務器和在線通話氛圍服務器可能是存在于同一臺服務器主機上。
視頻通話終端和在線語音視頻服務器和在線通話氛圍服務器通過基礎通信網相連接,他們之前的數據通信是雙向的。數據通信過程可能包含必要的用戶認證過程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建江夏學院,未經福建江夏學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710093114.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:視頻通話中能切換錄音源的系統及方法
- 下一篇:一種監控隨機目標的方法及系統





