[發明專利]計算機漢語有聲影像資料自動加注漢語字幕的方法在審
| 申請號: | 201210522655.6 | 申請日: | 2012-12-08 |
| 公開(公告)號: | CN103853708A | 公開(公告)日: | 2014-06-11 |
| 發明(設計)人: | 苗玉水 | 申請(專利權)人: | 上海能感物聯網有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G11B27/10;G10L15/183 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201111 上海市閔*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 漢語 有聲 影像 資料 自動 加注 字幕 方法 | ||
?
技術領域
本技術方案屬于嵌入式或非嵌入式計算機系統聲音和圖像數據處理技術領域,以下敘述中將嵌入式和非嵌入式計算機系統統稱為計算機系統。
背景技術
目前市面上的漢語有聲影像資料的漢字字幕疊加,一般通過人工方式將漢語有聲影像資料中的漢語轉換成漢字,再交給視頻畫面或影像畫面字幕疊加機將表達漢語意思的漢字字幕疊加在視頻畫面或影像畫面上,由于存在大量的沒有漢字字幕的漢語有聲影像資料,因此,采用人工轉換漢字字幕的方式費工費時,而且隨著數字有聲影像技術的出現,特別是計算機系統用于處理視頻影像資料的技術出現,越來越需要有一種能自動根據漢語語音轉換成漢語字幕的技術出現,而且這種能自動根據漢語語音轉換成漢語字幕的技術不但能在帶漢字系統的計算機系統中運行,還能在不帶漢字系統而只帶128個字符的ASCII碼系統的以美國為代表的西方國家的計算機系統中運行,以滿足世界互聯網的日益廣泛的運用和云計算、物聯網以及世界各地漢語熱出現的新形勢的需要。
發明內容
本技術方案的提出就是為了解決上述出現這些問題。具體來說本技術方案通過采用以下的計算機漢語有聲影像資料自動加注漢語字幕的方法來解決上述出現的問題:
在將漢語有聲影像資料自動加注漢語字幕時,首先通過現有計算機軟件做好影像資料中視頻畫面或影像畫面與對應的漢語有聲語言的音頻信號同步信號標志,然后將帶同步信號標志的有聲語言的音頻信號提取出來傳給計算機中的漢語語音識別模塊,漢語語音識別模塊將漢語語音識別成帶與所識別的漢語語音相同同步信號標志的漢語字幕,該帶同步信號標志的漢語字幕然后傳輸給傳統的視頻畫面或影像畫面字幕疊加機,根據漢語字幕與視頻畫面或影像畫面同步信號標志的對應關系將字幕信息疊加在視頻畫面或影像畫面上并合成在一起儲存或輸出。
上述的同步信號標志可以是現有技術的視頻畫面或影像畫面與對應的漢語有聲語言的音頻信號同步時間戳標志,所述的漢語字幕可以是漢字也可以是漢語語音碼,漢語語音碼或漢字能夠單獨或者漢語語音碼與漢字、漢語拼音、少數民族文字對照疊加在視頻畫面或影像畫面上并合成在一起儲存或輸出。
上述所述的漢語語音碼是以單詞為單位,這里將單個漢字看作單音節詞,根據組成該單詞的每個音節的《漢語拼音方案》中的拼音,用且僅用26個拉丁字母對漢語拼音的聲母、介母、韻母、聲調采取先編碼再依次按“聲碼+介碼+韻碼+調碼兼隔音節符號”的順序編碼拼寫,并通過得到的語音碼的編碼直接表達漢語信息,當直接用語音碼編碼來表示漢語信息時,其標點符號的用法同英文的標點符號的用法相同,編碼時同一個單詞的多個音節不用空格連續編碼,單詞與單詞之間要有空格隔開。
由于本技術方案采用26個拉丁字母表示的漢語語音碼來表達漢語信息,且當直接用語音碼編碼來表示漢語信息時,其標點符號的用法同英文的標點符號的用法相同,這樣就保證了漢語信息的表達連標點符號在內都與ASCII碼完全一致,也即與ASCII碼100%兼容,這樣上述漢語語音識別模塊,由于處理的漢語信息是用與ASCII碼完全一致的漢語語音碼來表示的,這樣就使得該模塊可以在ASCII碼系統的計算機中運行,因此,確保了計算機漢語有聲影像資料自動加注漢語字幕的方法可以在ASCII碼系統的計算機中運行,上述問題得以解決。
有了本技術方案以后,就能通過計算機自動根據漢語語音轉換成漢語字幕大大提高了有聲影像信息處理的效率,而且這種能自動根據漢語語音轉換成漢語字幕的技術不但能在帶漢字系統的計算機系統中運行,而且還能再不帶漢字系統只帶128個字符的ASCII碼系統的以美國為代表的西方國家的計算機系統中運行,這樣能夠更方便地利用西方先進的西文軟硬件資源來處理漢語字幕和圖像疊加的技術問題。
具體實施方式
下面結合實施例對本發明的具體實施方式作進一步的說明。
(一)本技術方案所采用的漢語語音碼的每一音節聲、韻、調的編碼方法采用以下的方法:
注:括號內的符號均為《漢語拼音方案》中的漢語拼音符號,以下簡稱為漢語拼音符號,不帶括號的字母為本方案所采用的漢語語音碼的每一音節聲、韻、調的編碼符號,以下將下列對照表簡稱為碼表;
1、聲碼的編碼符號采用與漢語拼音方案基本一致的聲母的字母符號,比如采用下面這種聲碼的編碼形式:
b:(b)??p?:?(p)??m:(m)???f:(f)???d:(d)?????????t:(t)
n:(n)??l:(l)????g:(g)???k:(k)???h:(h)??
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海能感物聯網有限公司,未經上海能感物聯網有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210522655.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:法拉第旋轉器和隔離器
- 下一篇:一種廢棄SCR催化劑回收利用的方法





