[發(fā)明專利]一種視頻字幕實(shí)時(shí)生成系統(tǒng)及生成方法有效
| 申請(qǐng)?zhí)枺?/td> | 201911422039.1 | 申請(qǐng)日: | 2019-12-31 |
| 公開(公告)號(hào): | CN111107284B | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 寧樂飛;陳天萍;陳文杰;蔡佳良;闞小優(yōu) | 申請(qǐng)(專利權(quán))人: | 洛陽樂往網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | H04N5/278 | 分類號(hào): | H04N5/278;H04N21/439 |
| 代理公司: | 洛陽九創(chuàng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 41156 | 代理人: | 炊萬庭 |
| 地址: | 471000 河南省洛陽市澗西區(qū)中國(河南)自*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視頻 字幕 實(shí)時(shí) 生成 系統(tǒng) 方法 | ||
1.一種視頻字幕實(shí)時(shí)生成方法,基于一種視頻字幕實(shí)時(shí)生成系統(tǒng),系統(tǒng)包括:
聲音靜默采集裝置,與視頻播放設(shè)備電性連接,用于從視頻播放設(shè)備獲取聲音原始電信號(hào);
前端處理裝置,與所述聲音靜默采集裝置和視頻播放設(shè)備均電性連接,用于對(duì)聲音原始電信號(hào)進(jìn)行處理生成聲音壓縮電信號(hào);
遠(yuǎn)端服務(wù)器,與所述前端處理裝置電性連接,用于根據(jù)聲音壓縮電信號(hào)生成字幕數(shù)據(jù)并且通過前端處理裝置將字幕數(shù)據(jù)發(fā)送給視頻播放設(shè)備;
其特征在于,所述方法包括如下步驟:
S1、判斷所述聲音靜默采集裝置的狀態(tài),若聲音靜默采集裝置就緒,則執(zhí)行S2,否則結(jié)束;
S2、啟動(dòng)視頻播放設(shè)備并且播放視頻;
S3、聲音靜默采集裝置通過內(nèi)錄方式從視頻播放設(shè)備獲取聲音原始電信號(hào),并且將聲音原始電信號(hào)發(fā)送給所述前端處理裝置;
S4、前端處理裝置依次對(duì)聲音原始電信號(hào)進(jìn)行抽樣、前處理和重采樣得到聲音壓縮電信號(hào),并且將聲音壓縮電信號(hào)發(fā)送給所述遠(yuǎn)端服務(wù)器;
S4中,抽樣的具體方法為:
S4.11、將聲音原始電信號(hào)分解為若干個(gè)連續(xù)的數(shù)據(jù)元,每N個(gè)數(shù)據(jù)元組成一組,每組數(shù)據(jù)元中抽取一個(gè)作為樣本集;
S4.12,將樣本集轉(zhuǎn)化為時(shí)域信號(hào),每N個(gè)信號(hào)為一組,每組信號(hào)中抽取一個(gè)作為初始樣本D;
S4.13、計(jì)算除了初始樣本D之外其余(N-1)個(gè)信號(hào)的絕對(duì)值之和SUM,并且計(jì)算
S4.14、若|D|≥
S4.15、重復(fù)執(zhí)行S4.11至S4.14直到將聲音原始電信號(hào)處理完畢得到聲音一次電信號(hào);
S5、遠(yuǎn)端服務(wù)器對(duì)聲音壓縮電信號(hào)進(jìn)行識(shí)別得到字幕數(shù)據(jù),并且將字幕數(shù)據(jù)發(fā)送給前端處理裝置;
S6、前端處理裝置將字幕數(shù)據(jù)發(fā)送給視頻播放設(shè)備;
S7、視頻播放設(shè)備在視頻字幕區(qū)顯示字幕數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其特征在于,所述前端處理裝置包括電性連接的核心處理器和通信模塊,其中核心處理器與所述聲音靜默采集裝置電性連接,通信模塊與所述遠(yuǎn)端服務(wù)器電性連接。
3.如權(quán)利要求1所述方法,其特征在于,S1的具體方法為:
S1.1、檢測所述聲音靜默采集裝置與視頻播放設(shè)備的連接狀態(tài),若連接正常則執(zhí)行S1.2,否則直接結(jié)束;
S1.2、檢測聲音靜默采集裝置的運(yùn)行狀況,若運(yùn)行正常則執(zhí)行S2,否則直接結(jié)束。
4.如權(quán)利要求1所述方法,其特征在于,S3中,所述聲音靜默采集裝置每經(jīng)過40ms向所述前端處理裝置發(fā)送一次聲音原始電信號(hào)并且清空緩存。
5.如權(quán)利要求4所述方法,其特征在于,S4中,在執(zhí)行S4.11之前對(duì)聲音原始電信號(hào)進(jìn)行抗混疊濾波處理。
6.如權(quán)利要求4所述方法,其特征在于,S4中,前處理的具體方法為:
S4.21、按照20ms為一幀的方式將聲音一次電信號(hào)分解為若干幀數(shù)據(jù);
S4.22、利用漢明窗或者漢寧窗對(duì)每幀數(shù)據(jù)進(jìn)行平滑處理;
S4.23、利用低通濾波算法對(duì)平滑處理后的數(shù)據(jù)進(jìn)行抗混疊濾波處理。
7.如權(quán)利要求1所述方法,其特征在于,S4中,重采樣后的頻率為16000HZ、量化位數(shù)為16bit。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于洛陽樂往網(wǎng)絡(luò)科技有限公司,未經(jīng)洛陽樂往網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911422039.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 實(shí)時(shí)解碼系統(tǒng)與實(shí)時(shí)解碼方法
- 實(shí)時(shí)穩(wěn)定
- 實(shí)時(shí)監(jiān)控裝置、實(shí)時(shí)監(jiān)控系統(tǒng)以及實(shí)時(shí)監(jiān)控方法
- 實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流傳輸
- 實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流傳輸
- 實(shí)時(shí)通信方法和實(shí)時(shí)通信系統(tǒng)
- 實(shí)時(shí)更新
- 實(shí)時(shí)內(nèi)核
- 用于通信網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備及相關(guān)方法
- 實(shí)時(shí)量化方法及實(shí)時(shí)量化系統(tǒng)





