[發明專利]一種音頻文字直播系統在審
| 申請號: | 201711131745.1 | 申請日: | 2017-11-15 |
| 公開(公告)號: | CN107820112A | 公開(公告)日: | 2018-03-20 |
| 發明(設計)人: | 虞焰興 | 申請(專利權)人: | 安徽聲訊信息技術有限公司 |
| 主分類號: | H04N21/43 | 分類號: | H04N21/43;G10L15/26;G10L15/22 |
| 代理公司: | 上海精晟知識產權代理有限公司31253 | 代理人: | 馮子玲 |
| 地址: | 230000 安徽省合肥*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 文字 直播 系統 | ||
技術領域
本發明屬于語音文字同步技術領域,特別是涉及一種音頻文字直播系統。
背景技術
語音文字是基于音頻輸入,然后進行文字轉換的操作,有助于將音頻與文字同時顯示的技術,而非經過后期處理的語音文字同步技術。將語音音頻數據轉換成文字信息進行顯示的方式,現有技術存在轉換錯誤率高,語音音頻與文字同步延時性長。
發明內容
本發明的目的在于提供一種音頻文字直播系統,通過設置音頻采集終端采集音頻傳輸至語音識別服務器進行語音識別,并轉寫成文字,通過中心服務器將音頻數據和文字信息進行合成和校正,同步進行合成、播放、顯示文字、校正;將校正后的文件推送至終端設備;實時同步性好,實現了音頻文字直播,解決了現有的問題。
為解決上述技術問題,本發明是通過以下技術方案實現的:
本發明為一種音頻文字直播系統,包括用于識別語音并將音頻轉寫為文字的語音識別服務器;用于采集音頻并將轉寫文字進行分發的音頻采集終端;所述音頻采集終端嵌入有音頻采集模塊、文字分發器和通信模塊;所述音頻采集終端將音頻采集模塊采集的音頻文件通過通信模塊傳輸至語音識別服務器;所述文字分發器將語音識別服務器返回的文字進行分發;用于錄音并推送音頻的音頻服務器;所述音頻服務器包括錄音單元、解碼單元和音頻推送器;所述錄音單元將音頻采集模塊采集的音頻文件進行保存;所述解碼單元對音頻采集文件采集的音頻進行解碼;所述音頻推送器將音頻文件進行推送;用于音頻文字合成、修正以及分發的中心服務器;所述中心服務器包括合成單元、修正單元和推送單元;所述合成單元將音頻推送器推送的音頻數據和文字分發器分發的文字數據進行合成;所述修正單元對合成單元后的文件進行校正修改;所述推送單元將校正后的文件推送至終端設備;用于播放音頻和顯示文字信息的終端設備。
進一步地,所述語音識別服務器將音頻采集終端傳輸的音頻數據進行識別和轉寫成文字,并同步將轉寫文字返回至音頻采集終端。
進一步地,所述文字分發器將語音識別服務器返回的文字分發至中心服務器,一邊傳輸一邊推送,方便提高了同步率。
進一步地,所述音頻推送器將解碼后的音頻數據推送至中心服務器,同時進行錄音、解碼和音頻推送。
進一步地,所述解碼單元將音頻采集終端傳輸的音頻數據進行解碼,并將音頻數據內嵌入時間信息,時間信息為時間戳。
進一步地,所述合成單元根據解碼后的音頻數據時間信息將音頻推送器推送的音頻數據信息和文字分發器分發的文字數據信息合成為音頻文字同步播放的文件。
進一步地,所述合成單元將合成后的文字實時傳輸至修正單元,所述修正單元對合成文件進行實時校正,并將校正后的數據信息通過推送單元實時同步推送至若干個終端設備;實現了同步合成、播放、文字顯示、文字校正和文件推送。
進一步地,所述通信模塊包括有線網絡或WIFI無線網絡或3G/4G移動網絡。
進一步地,所述終端設備采用電腦或手機或智能平板。
本發明具有以下有益效果:
本發明通過設置音頻采集終端采集音頻傳輸至語音識別服務器進行語音識別,并轉寫成文字,通過中心服務器將音頻數據和文字信息進行合成和校正,同步進行合成、播放、顯示文字、校正;將校正后的文件推送至終端設備;實時同步性好,實現了音頻文字直播。
當然,實施本發明的任一產品并不一定需要同時達到以上所述的所有優點。
附圖說明
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明的系統框圖。
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其它實施例,都屬于本發明保護的范圍。
實施例一
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽聲訊信息技術有限公司,未經安徽聲訊信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711131745.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種飛鼠遙控的方法、客戶端及服務器
- 下一篇:視頻播放方法及裝置





