[發(fā)明專利]一種電子文檔轉(zhuǎn)換方法及裝置有效
| 申請?zhí)枺?/td> | 201810961753.7 | 申請日: | 2018-08-22 |
| 公開(公告)號: | CN109213974B | 公開(公告)日: | 2022-12-20 |
| 發(fā)明(設(shè)計)人: | 陳雯;朱海軍 | 申請(專利權(quán))人: | 北京慕華信息科技有限公司 |
| 主分類號: | G06F40/151 | 分類號: | G06F40/151 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 徐麗 |
| 地址: | 100083 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電子 文檔 轉(zhuǎn)換 方法 裝置 | ||
本申請?zhí)峁┝艘环N電子文檔轉(zhuǎn)換方法及裝置,其中,該方法包括:獲取待處理視頻的字幕文件,進(jìn)而提取待處理視頻的語速特征,然后根據(jù)語速特征,對字幕文件進(jìn)行分段處理,并為分段處理后的字幕文件添加標(biāo)點符號,進(jìn)一步地,從分段處理后的每一段字幕文件對應(yīng)的待處理視頻的視頻幀中選取關(guān)鍵幀,并記錄每一段字幕文件與選取的關(guān)鍵幀之間的對應(yīng)關(guān)系,最后基于經(jīng)分段處理并添加標(biāo)點符號后的每一段字幕文件、以及每一段字幕文件與選取的關(guān)鍵幀之間的對應(yīng)關(guān)系,創(chuàng)建用于描述待處理視頻的電子文檔。通過這種方式,可以將待處理的視頻轉(zhuǎn)換為有排版、有格式的文本,還能提取視頻中的關(guān)鍵幀,結(jié)合上述文本構(gòu)成電子文檔,形象的表現(xiàn)出待處理視頻的相關(guān)信息。
技術(shù)領(lǐng)域
本申請涉及計算機(jī)技術(shù)領(lǐng)域,尤其是涉及一種電子文檔轉(zhuǎn)換方法及裝置。
背景技術(shù)
隨著計算機(jī)網(wǎng)絡(luò)的發(fā)展,越來越多的信息以視頻的形式呈現(xiàn)給大眾。但是,網(wǎng)絡(luò)視頻的在線觀看需要耗費大量的流量。例如一些在線教育視頻,其針對的群體往往是學(xué)生,然而學(xué)生的大部分時間是處于沒有無線網(wǎng)絡(luò)的環(huán)境中,無法滿足觀看在線教育產(chǎn)品所需的網(wǎng)絡(luò)條件,因此對于在線教育產(chǎn)品無法充分利用。
目前,為滿足不同網(wǎng)絡(luò)條件下用戶的需求,可以將視頻文件(如在線教育視頻)轉(zhuǎn)換成文本,然而將視頻或音頻轉(zhuǎn)換為電子文本文檔時,最大的問題是轉(zhuǎn)換后的文本無格式無排版,段落不明,斷句混亂,若需對文本進(jìn)行調(diào)整只能后期依靠人工,過程繁瑣且費時費力。
發(fā)明內(nèi)容
有鑒于此,本申請的目的在于提供一種電子文檔轉(zhuǎn)換方法及裝置,以簡化視頻或音頻轉(zhuǎn)換成文本后人工調(diào)整文本格式的步驟。
第一方面,本申請實施例提供了一種電子文檔轉(zhuǎn)換方法,該方法包括:
獲取待處理視頻的字幕文件;
提取所述待處理視頻的語速特征;
根據(jù)所述語速特征,對所述字幕文件進(jìn)行分段處理,并為分段處理后的字幕文件添加標(biāo)點符號;
從分段處理后的每一段字幕文件對應(yīng)的所述待處理視頻的視頻幀中選取關(guān)鍵幀,并記錄每一段字幕文件與選取的關(guān)鍵幀之間的對應(yīng)關(guān)系;
基于經(jīng)分段處理并添加標(biāo)點符號后的每一段字幕文件、以及每一段字幕文件與選取的關(guān)鍵幀之間的對應(yīng)關(guān)系,創(chuàng)建用于描述所述待處理視頻的電子文檔。
結(jié)合第一方面,本申請實施例提供了第一方面的第一種可能的實施方式,其中,所述語速特征包括所述字幕文件中每個句子的平均語速、以及相鄰句子之間的停頓間隔;
根據(jù)所述語速特征,對所述字幕文件進(jìn)行分段處理,包括:
計算當(dāng)前的句子相鄰的前一個句子的平均語速與所述當(dāng)前的句子的平均語速之前的第一比值;以及,計算所述當(dāng)前的句子與所述前一個句子之間的停頓間隔和所述當(dāng)前的句子與所述當(dāng)前的句子相鄰的后一個句子的停頓間隔之間的第二比值;
基于計算的所述第一比值、以及所述第二比值,確定所述字幕文件中相鄰句子之間的相關(guān)性系數(shù)值;
當(dāng)計算出的相關(guān)性系數(shù)值小于第一預(yù)設(shè)閾值時,將所述當(dāng)前的句子相鄰的前一個句子與所述當(dāng)前的句子之間的位置作為分段的劃分點,將所述前一個句子作為上一段字幕文件中的最后一個句子,將所述當(dāng)前的句子作為當(dāng)前段字幕文件中的第一個句子。
結(jié)合第一方面,本申請實施例提供了第一方面的第二種可能的實施方式,其中,在創(chuàng)建用于描述所述待處理視頻的電子文檔之后,還包括:
提取所述字幕文件中的關(guān)鍵詞,其中所述關(guān)鍵詞用于標(biāo)識所述電子文檔。
結(jié)合第一方面的第二種可能的實施方式,本申請實施例提供了第一方面的第三種可能的實施方式,其中,提取所述字幕文件中的關(guān)鍵詞,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京慕華信息科技有限公司,未經(jīng)北京慕華信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810961753.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像轉(zhuǎn)換設(shè)備、圖像轉(zhuǎn)換電路及圖像轉(zhuǎn)換方法
- 數(shù)模轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 轉(zhuǎn)換設(shè)備和轉(zhuǎn)換方法
- 占空比轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 通信轉(zhuǎn)換方法、轉(zhuǎn)換裝置及轉(zhuǎn)換系統(tǒng)
- 模數(shù)轉(zhuǎn)換和模數(shù)轉(zhuǎn)換方法
- 轉(zhuǎn)換模塊以及轉(zhuǎn)換電路
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件和熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊





