[發(fā)明專利]一種語音和視頻字幕同步呈現(xiàn)的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 200910037300.6 | 申請日: | 2009-02-20 |
| 公開(公告)號: | CN101505397A | 公開(公告)日: | 2009-08-12 |
| 發(fā)明(設(shè)計)人: | 楊海曜 | 申請(專利權(quán))人: | 深圳華為通信技術(shù)有限公司 |
| 主分類號: | H04N7/15 | 分類號: | H04N7/15;H04N5/262 |
| 代理公司: | 廣州三環(huán)專利代理有限公司 | 代理人: | 郝傳鑫;熊賢卿 |
| 地址: | 518129廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 視頻 字幕 同步 呈現(xiàn) 方法 系統(tǒng) | ||
1.一種語音和視頻字幕同步呈現(xiàn)的方法,其特征在于,包括以下步驟:
接收到語音信息;
通過解析所述接收到的語音信息,識別出該語音信息對應(yīng)的文字內(nèi)容信息;
根據(jù)全局指針、逐句指針以及逐字指針查找預(yù)置文字內(nèi)容信息,并逐字逐 句地將所述識別出的文字內(nèi)容信息與所述查找到的預(yù)置文字內(nèi)容信息進行對 比,得出所述識別出的文字內(nèi)容信息與所述預(yù)置文字內(nèi)容信息的相似度;
判斷所述相似度是否達到預(yù)設(shè)的文字相關(guān)度,當(dāng)判斷為是時,則判定所述 識別出的語音信息對應(yīng)的文字內(nèi)容信息與所述預(yù)置的文字內(nèi)容信息匹配;
其中,所述全局指針用于定位到預(yù)置文字內(nèi)容信息中的某個段落位置;
所述逐句指針用于定位到所述某個段落的某個句子上;
所述逐字指針用于定位到所述某個句子中的某個字或詞;
視頻同步顯示所述語音信息對應(yīng)的預(yù)置文字內(nèi)容。
2.如權(quán)利要求1所述的方法,其特征在于,所述判斷所述識別出的文字內(nèi) 容信息與預(yù)置文字內(nèi)容信息是否匹配之前還包括:
接收并保存預(yù)置文字內(nèi)容信息。
3.如權(quán)利要求1所述的方法,其特征在于,所述視頻同步顯示所述語音信 息對應(yīng)的預(yù)置文字內(nèi)容包括:
當(dāng)判定所述識別出的語音信息對應(yīng)的文字內(nèi)容信息與所述預(yù)置的文字內(nèi)容 信息匹配時,啟動字幕超前顯示模式對所述預(yù)置文字內(nèi)容信息進行顯示,即在 一句語音信息未接收完成前,提前顯示與所述一句語音信息相匹配的預(yù)置文字 內(nèi)容信息;
或,當(dāng)判定所述識別出的語音信息對應(yīng)的文字內(nèi)容信息與所述預(yù)置的文字 內(nèi)容信息匹配時,啟動全句語音識別顯示模式對所述預(yù)置文字內(nèi)容信息進行顯 示,即在一句語音信息接收并識別完成后,才顯示與所述一句語音相匹配的預(yù) 置文字內(nèi)容信息。
4.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)的文字相關(guān)度包括字 相關(guān)度、句子相關(guān)度以及段落相關(guān)度中一種或多種。
5.如權(quán)利要求1所述的方法,其特征在于,當(dāng)判斷所述相似度是否達到預(yù) 設(shè)的文字相關(guān)度的判斷結(jié)果為否時,輸出異常。
6.一種語音和視頻字幕同步呈現(xiàn)的系統(tǒng),其特征在于,包括:
語義識別模塊,用于接收語音信息,并通過解析所述接收到的語音信息, 識別出該語音信息對應(yīng)的文字內(nèi)容信息;
查找單元,用于根據(jù)全局指針、逐句指針以及逐字指針查找預(yù)置文字內(nèi)容 信息,其中,所述全局指針用于定位到預(yù)置文字內(nèi)容信息中的某個段落位置; 所述逐句指針用于定位到所述某個段落的某個句子上;所述逐字指針用于定位 到所述某個句子中的某個字或詞;
判斷單元,用于逐字逐句地將所述識別出的文字內(nèi)容信息與所述查找到的 預(yù)置文字內(nèi)容信息進行對比,得出所述識別出的文字內(nèi)容信息與所述預(yù)置文字 內(nèi)容信息的相似度;判斷所述相似度是否達到預(yù)設(shè)的文字相關(guān)度,當(dāng)判斷為是 時,則判定所述識別出的語音信息對應(yīng)的文字內(nèi)容信息與所述預(yù)置的文字內(nèi)容 信息匹配;
顯示模塊,用于當(dāng)所述判斷單元判斷為是時,在顯示視頻時,同步顯示所 述預(yù)置文字內(nèi)容。
7.如權(quán)利要求6所述的語言和視頻字幕同步呈現(xiàn)的系統(tǒng),其特征在于,還 包括:
預(yù)置模塊,用于接收并保存預(yù)置文字內(nèi)容信息。
8.如權(quán)利要求6所述的語言和視頻字幕同步呈現(xiàn)的系統(tǒng),其特征在于,所 述顯示模塊進一步包括:顯示控制單元,用于控制所述預(yù)置文字內(nèi)容信息的顯 示輸出模式,所述顯示輸出模式包括字幕超前顯示模式或全句語音識別顯示模 式;
顯示輸出單元,用于根據(jù)所述顯示控制單元的控制,按照字幕超前顯示模 式顯示所述預(yù)置文字內(nèi)容信息或按照全句語音識別顯示模式顯示所述預(yù)置文字 內(nèi)容信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳華為通信技術(shù)有限公司,未經(jīng)深圳華為通信技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910037300.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





