[發明專利]一種應急廣播音頻處理系統及其運行方法在審
| 申請號: | 202011238809.X | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112349268A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 黎捷;徐順暖;朱磊 | 申請(專利權)人: | 湖南芒果聽見科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/033;G10L15/16;H04L9/32;H04H20/59 |
| 代理公司: | 北京精金石知識產權代理有限公司 11470 | 代理人: | 肖樂愈秋 |
| 地址: | 410005 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應急 廣播 音頻 處理 系統 及其 運行 方法 | ||
1.一種應急廣播音頻處理系統,其特征在于:包括依次連接的應急語音合成端、應急音頻處理端和應急廣播平臺,其中,
所述應急語音合成端用于接收應急信息文稿,將所述應急信息文稿合成應急配音,發送給所述應急音頻處理端;
所述應急音頻處理端用于接收所述應急配音,對其進行音頻處理后,形成應急廣播信息,發送給所述應急廣播平臺;
所述應急廣播平臺用于接收所述應急廣播信息,并向用戶播放所述應急廣播信息。
2.根據權利要求1所述的一種應急廣播音頻處理系統,其特征在于:所述應急語音合成端包括虛擬主播音庫和語音合成模塊。
3.根據權利要求2所述的一種應急廣播音頻處理系統,其特征在于:所述虛擬主播音庫通過采集專業主播音頻,經音庫訓練平臺進行算法調試后形成。
4.根據權利要求3所述的一種應急廣播音頻處理系統,其特征在于:所述音庫訓練平臺使用的算法為基于卷積神經網絡算法。
5.根據權利要求2至4任一所述的一種應急廣播音頻處理系統,其特征在于:所述語音合成模塊為基于web.api方式的TTS引擎。
6.根據權利要求1至4任一所述的一種應急廣播音頻處理系統,其特征在于:所述應急音頻處理端包括FFmpeg嵌入模塊和java轉譯模塊,所述應急音頻處理端將FFmpeg組件進行基于java轉譯,再用互聯網基本架構實現其智能處理音頻的能力。
7.一種應急廣播音頻處理系統運行方法,利用上述權利要求1至6任一所述的應急廣播音頻處理系統,其特征在于:包括以下步驟,
S1:所述應急語音合成端接收應急信息文稿,將所述應急信息文稿合成應急配音,發送給所述應急音頻處理端;
S2:所述應急音頻處理端接收所述應急配音,對其進行音頻處理后,形成應急廣播信息,發送給所述應急廣播平臺;
S3:所述應急廣播平臺接收所述應急廣播信息,并向用戶播放所述應急廣播信息。
8.根據權利要求7所述的一種應急廣播音頻處理系統運行方法,其特征在于:所述S1包括以下步驟,
S11:按機器學習與標注所需的規范標準采集專業主播的配音素材;
S12:對所述配音素材進行篩選,對發音進行標簽,轉至音庫訓練平臺進行基于卷積神經網絡算法的機器學習,經過不斷地算法調優,逐步形成擬合原始主播發音水平的虛擬主播;
S13:所述虛擬主播交付后,需完成基于web.api方式的TTS引擎搭建,支持多路并發與雙向回調,按應急廣播的國家標準實現文字轉語音的快速完成,支持海量信息的同時并發;
S14:將已審核過的應急信息文稿輸入TTS引擎,進行配音。
9.根據權利要求7或8所述的一種應急廣播音頻處理系統運行方法,其特征在于:所述S2包括以下步驟,
S21:嵌入FFmpeg組件,將開源的音頻視頻處理的主流軟件FFmpeg進行基于java轉譯;
S22:使用互聯網基本架構實現其大批量與智能處理音頻的能力,完成音頻后期處理;
S23:合成的配音與音頻后期處理平臺結合,生成音頻節目,自定義地調節語速、背景音樂、片頭、片尾。
10.根據權利要求7或8所述的一種應急廣播音頻處理系統運行方法,其特征在于:所述S3包括以下步驟,
S31:合成后的音頻節目通過語音識別技術再次確認其合規性;
S32:通過審核的音頻推送至所述應急廣播平臺,用RTMP協議推流方式向用戶播報。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南芒果聽見科技有限公司,未經湖南芒果聽見科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011238809.X/1.html,轉載請聲明來源鉆瓜專利網。





