[發明專利]利用計算機系統進行的電視新聞標引方法有效
| 申請號: | 200910030960.1 | 申請日: | 2009-04-17 |
| 公開(公告)號: | CN101539929A | 公開(公告)日: | 2009-09-23 |
| 發明(設計)人: | 陳一宏;尹遜鈺;吳鵬 | 申請(專利權)人: | 無錫天脈聚源傳媒科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/32;G10L15/00 |
| 代理公司: | 南京經緯專利商標代理有限公司 | 代理人: | 任 益 |
| 地址: | 214028江蘇省無錫市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 計算機系統 進行 電視新聞 標引 方法 | ||
1.一種利用計算機系統進行的電視新聞標引方法,其特征在于,包括如下步驟:
(1)、視頻采集和分段:從數字電視機頂盒的輸出信號AV端子將電視節目信號導入帶有視頻采集卡的計算機,生成數字化的可進一步處理的視頻文件,可導入的電視節目信號包括衛星電視信號、CATV電視信號、數字電視信號、經AV接口/RCA接口/BNC接口/DVI接口輸入的電視信號,“視頻采集卡”根據電視信號指令,經A/D轉換,將電視信號采集為數字文件,并保存在“大容量存儲器”的“原始素材區”,并按MD5算法分配一個32位唯一ID,用來將來唯一標識,采集后的視頻文件格式為mpeg2,包括一個視頻流和一個音頻流,視頻為mpeg2編碼格式,音頻為mp3編碼格式,均為國際標準格式,便于后期處理,
“視頻采集服務器”內運行一個定時器,當定時器觸發時會調用視頻分段程序,該程序依據視頻轉場識別技術將大段的視頻切分為獨立的視頻文件,每個視頻文件作為一個完整的電視新聞節目,然后存入“大容量存儲器”的“待處理素材區”;
(2)、視頻預處理:進入存儲器中的視頻文件進入大容量存儲器的“待處理素材區”工作,通過信道分離方法,將聲音和畫面進行分離,源視頻文件將會根據視頻畫面轉換特征和聲學特征進行切分,將聲音或畫面分別切分成較小的內容顆粒;
(3)、連續語音識別:通過將步驟(2)產生的內容顆粒通過以太網接口讀入內存,對步驟(2)生成的內容顆粒中的波形語音進行處理和識別,包括降噪、剔除非語音信號、語言識別、說話人識別共4項前期處理,然后選擇適用的聲學模型和語言模型,將波形語音信號轉換為文本;
(4)、圖像文字識別:通過以太網接口將步驟(3)語音識別出的文本讀入內存,然后取出步驟(2)產生的內容顆粒中已經切分好的圖像文件,并放置在緩存區;逐一讀取圖像文件作為輸入,以字符特征作為比較,檢查圖像中是否包含有字幕文本信息,如果有,則對緩存區的圖像進行處理和識別,包括畫面切分、畫面特征分析、畫面文字信息發現,然后對發現的文字信息進行識別轉換;
(5)、文本糾錯與分詞:以上(3)和(4)步驟獲取的文本信息作為原始素材送入糾錯分詞服務器中運行進行二次處理,發現原始素材中的文字錯誤并自動更正,然后對連續的文字從語義角度進行分詞和提取關鍵詞,形成視頻節目的標引信息;
(6)、有人監督的校對:經步驟(5)二次處理生成的標引信息進行有人監督的校對,校對引擎將標引信息文件讀取顯示在顯示器上,同時根據時間點信息同步播放對應的媒體文件,如果編輯人員發現標引有錯誤,則通過鍵盤或鼠標操作計算機系統,使播放暫停,然后修改為正確的標引值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫天脈聚源傳媒科技有限公司,未經無錫天脈聚源傳媒科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910030960.1/1.html,轉載請聲明來源鉆瓜專利網。





