[發明專利]一種語音和視頻字幕同步呈現的方法及系統有效
| 申請號: | 200910037300.6 | 申請日: | 2009-02-20 |
| 公開(公告)號: | CN101505397A | 公開(公告)日: | 2009-08-12 |
| 發明(設計)人: | 楊海曜 | 申請(專利權)人: | 深圳華為通信技術有限公司 |
| 主分類號: | H04N7/15 | 分類號: | H04N7/15;H04N5/262 |
| 代理公司: | 廣州三環專利代理有限公司 | 代理人: | 郝傳鑫;熊賢卿 |
| 地址: | 518129廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 視頻 字幕 同步 呈現 方法 系統 | ||
技術領域
本發明涉及通信領域,尤其涉及一種語音和視頻字幕同步呈現的方法和系 統。
背景技術
一般在會議電視和視頻演講中,大多數情況下演講者一般是采用有稿件的 宣讀講演,根據國際會議的調查發現,一般對著講稿進行宣讀的會議議題,約 占大中型會議的演講者發言70%時間以上,這70%中同時有配合膠片,而同時 又按照講演稿進行宣讀的,又占有40%,不配有演講膠片,而直接口頭按照講 稿宣讀的,約有30%左右,也就是說即使是即興演講發揮也不到30%,稿件一 般不提前發給參與者,而采用朗讀方式,一般沒有字幕,這樣就不便于理解。 另有一種情況是進行演講錄像,然后重新配音或配上字幕,便于聽眾理解。進 行錄像后配字幕或配音的方式中,常見的有同聲字幕顯示,所述同聲字幕顯示 一般采用人工識別演講者的語義,而且是離線手工操作鍵入字幕,這種方式常 用于錄播中。另外就是同聲傳譯,一般演講者采用不同于聽眾的語音,在另外 的聲音信道上落后一段時間后進行人工翻譯,一般字幕或翻譯的語音在時間落 后于演講者語義1至2分鐘。
采用同聲字幕顯示,錄像后才能配上字幕,完全非實時的,不能用于現場 的會議電視和視頻演講中。而同聲傳譯,實時性也較差。
發明內容
有鑒于此,本發明實施例提供一種語音和視頻字幕同步呈現的方法和系統, 實現了視屏字幕的實時性,且不易出錯,演講者和參與者能夠很好的互動。
本發明實施例提供了一種語音和視頻字幕同步呈現的方法,包括以下步驟:
接收到語音信息;
通過解析所述接收到的語音信息,識別出該語音信息對應的文字內容信息;
根據全局指針、逐句指針以及逐字指針查找預置文字內容信息,并逐字逐 句地將所述識別出的文字內容信息與所述查找到的預置文字內容信息進行對 比,得出所述識別出的文字內容信息與所述預置文字內容信息的相似度;
判斷所述相似度是否達到預設的文字相關度,當判斷為是時,則判定所述 識別出的語音信息對應的文字內容信息與所述預置的文字內容信息匹配;
其中,所述全局指針用于定位到預置文字內容信息中的某個段落位置;
所述逐句指針用于定位到所述某個段落的某個句子上;
所述逐字指針用于定位到所述某個句子中的某個字或詞;
視頻同步顯示所述語音信息對應的預置文字內容。
本發明同時還提供了一種語音和視頻字幕同步呈現的系統,包括:
語義識別模塊,用于接收語音信息,并通過解析所述接收到的語音信息, 識別出該語音信息對應的文字內容信息;
查找單元,用于根據全局指針、逐句指針以及逐逐字指針查找預置文字內 容信息,其中,所述全局指針用于定位到預置文字內容信息中的某個段落位置; 所述逐句指針用于定位到所述某個段落的某個句子上;所述逐逐字指針用于定 位到所述某個句子中的某個字或詞;
判斷單元,用于逐字逐句地將所述識別出的文字內容信息與所述查找到的 預置文字內容信息進行對比,得出所述識別出的文字內容信息與所述預置文字 內容信息的相似度;判斷所述相似度是否達到預設的文字相關度,當判斷為是 時,則判定所述識別出的語音信息對應的文字內容信息與所述預置的文字內容 信息匹配;
顯示模塊,用于當所述判斷單元判斷為是時,在顯示視頻時,同步顯示所 述預置文字內容。
實施本發明實施例,接收到語音信息,通過解析所述接收到的語音信息識 別出該語音信息對應的文字內容信息,判斷所述識別出的該語音信息對應的文 字內容信息與預置文字內容信息是否相同,當判斷為是時,視頻同步顯示所述 語音信息對應的預置文字內容,實現了視屏字幕同步顯示的實時性,且不易出 錯,使演講者和參與者能夠很好的互動。
附圖說明
圖1是本發明實施例語音和視頻字幕同步呈現的系統的示意圖;
圖2是本發明實施例語音和視頻字幕同步呈現的系統語義識別模塊的結構 示意圖;
圖3是本發明實施例語音和視頻字幕同步呈現的系統處理模塊的結構示意 圖;
圖4是本發明實施例語音和視頻字幕同步呈現的系統處理模塊的判斷單元 的結構示意圖;
圖5是圖4中的顯示模塊的結構示意圖;
圖6是本發明實施例語音和視頻字幕同步呈現的方法的流程圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華為通信技術有限公司,未經深圳華為通信技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910037300.6/2.html,轉載請聲明來源鉆瓜專利網。





