[發(fā)明專利]一種多媒體節(jié)目識別方法和裝置在審

申請?zhí)枺?/td>	201410012734.1	申請日：	2014-01-10
公開（公告）號：	CN103747277A	公開（公告）日：	2014-04-23
發(fā)明（設(shè)計）人：	李鵬;陸承恩;黃曉敏;趙光玉	申請（專利權(quán)）人：	北京酷云互動科技有限公司
主分類號：	H04N21/233	分類號：	H04N21/233;H04N21/439;H04N21/462;G10L19/018
代理公司：	暫無信息	代理人：	暫無信息
地址：	100007 北京市東城***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種多媒體節(jié)目識別方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及多媒體信息技術(shù)領(lǐng)域，尤其涉及一種多媒體節(jié)目識別方法和裝置。

背景技術(shù)

隨著信息技術(shù)的發(fā)展，人們可以通過多種途徑瀏覽多媒體信息，例如在線觀看視頻、電視節(jié)目等等。人們也希望能夠在瀏覽多媒體內(nèi)容的同時，獲得更多與多媒體內(nèi)容相關(guān)的信息。為了能夠獲取多媒體內(nèi)容相關(guān)的信息，首先需要對多媒體節(jié)目進行識別。

聲印碼（Audio?Watermarking?Code）是一種音頻水印技術(shù)，通常是在音頻的頻譜中嵌入一段不影響人耳聽覺的信息，該信息可以從音頻文件或通過錄音設(shè)備解析出來。音頻水印可以用于版權(quán)保護，以及嵌入標題信息等。而音頻指紋是指從音頻中提取的特征信息的技術(shù)，與音頻水印技術(shù)的區(qū)別的關(guān)鍵在于：水印技術(shù)是將信息嵌入到音頻中，而音頻指紋技術(shù)則是從音頻中提取特征指紋。

本發(fā)明的發(fā)明人發(fā)現(xiàn)，音頻水印技術(shù)需要改變原始音頻的數(shù)據(jù)，雖然對人耳聽覺感官的影響較小，但是降低了音頻的質(zhì)量，而且必須對音頻嵌入水印信息，因此降低了應(yīng)用的范圍。

而音頻指紋技術(shù)是從原始音頻中提取信息，不會對原始的音頻做任何修改，因此不影響原始音頻的質(zhì)量，其缺點是識別時間略長，一般需要大于5秒的時間，并且精度與穩(wěn)定性不如音頻水印技術(shù)。

發(fā)明內(nèi)容

本發(fā)明實施例提供一種多媒體節(jié)目識別方法和裝置，通過音頻水印與音頻指紋相結(jié)合，達到快速而準確的音頻匹配與多媒體節(jié)目識別的目的。

為達上述目的，本發(fā)明實施例采用以下技術(shù)方案：

一種多媒體節(jié)目識別方法，所述方法包括：

獲取關(guān)于目標多媒體節(jié)目的音頻水印和音頻指紋；

將所述音頻水印與預(yù)設(shè)的音頻水印樣本進行匹配，獲得第一匹配結(jié)果，以及將所述音頻指紋與預(yù)設(shè)的音頻指紋樣本進行匹配，獲得第二匹配結(jié)果；

通過預(yù)設(shè)的混合模型合并所述第一匹配結(jié)果與所述第二匹配結(jié)果，獲得第三匹配結(jié)果；

根據(jù)所述第三匹配結(jié)果獲得所述目標多媒體節(jié)目的識別結(jié)果

通過音頻指紋與音頻水印的結(jié)合對目標多媒體節(jié)目進行音頻識別，匹配出與目標多媒體節(jié)目對應(yīng)的多媒體文件信息，達到快速而準確的音頻匹配與識別的效果。

所述方法還包括：根據(jù)所述目標多媒體節(jié)目的識別結(jié)果，獲取與所述目標多媒體節(jié)目對應(yīng)的關(guān)聯(lián)信息。以實現(xiàn)與多媒體信息相關(guān)的信息推送。

由終端設(shè)備或服務(wù)器實現(xiàn)所述方法。可以在線或離線方式進行音頻識別處理。

由終端實現(xiàn)所述方法；所述方法還包括：輸出表示是否展示關(guān)聯(lián)信息的提示信息；接收輸入的確認指令；根據(jù)收到的確認指令，展示所述關(guān)聯(lián)信息。根據(jù)用戶需求呈現(xiàn)關(guān)聯(lián)信息。

所述獲取關(guān)于目標多媒體節(jié)目的音頻水印和音頻指紋包括：采集所述目標多媒體節(jié)目的音頻數(shù)據(jù)，從所述目標多媒體節(jié)目的音頻數(shù)據(jù)中獲取所述多媒體節(jié)目的音頻水印和音頻指紋，或錄制所述目標多媒體節(jié)目播放時的音頻，以獲取所述目標多媒體節(jié)目的音頻水印和音頻指。

通過預(yù)設(shè)的混合模型合并第一匹配結(jié)果與第二匹配結(jié)果，獲得第三匹配結(jié)果，包括：通過可訓(xùn)練混合模型合并第一匹配結(jié)果與第二匹配結(jié)果。有利于保持匹配結(jié)果的準確度。

一種多媒體節(jié)目識別裝置，所述裝置包括：

第一獲取模塊，用于獲取關(guān)于目標多媒體節(jié)目的音頻水印和音頻指紋；

匹配模塊，用于將所述音頻水印與預(yù)設(shè)的音頻水印樣本進行匹配，獲得第一匹配結(jié)果，以及將所述音頻指紋與預(yù)設(shè)的音頻指紋樣本進行匹配，獲得第二匹配結(jié)果；

合并模塊，用于通過預(yù)設(shè)的混合模型合并所述第一匹配結(jié)果與所述第二匹配結(jié)果，獲得第三匹配結(jié)果；

獲得模塊，根據(jù)所述第三匹配結(jié)果獲得所述目標多媒體節(jié)目的識別結(jié)果。

所述裝置還包括：第二獲取模塊，用于根據(jù)所述目標多媒體節(jié)目的識別結(jié)果，獲取與所述目標多媒體節(jié)目對應(yīng)的關(guān)聯(lián)信息。

所述裝置還包括：提示模塊，用于輸出表示是否展示關(guān)聯(lián)信息的提示信息接收模塊，用于接收輸入的確認指令；展示模塊，用于根據(jù)收到的確認指令，展示所述關(guān)聯(lián)信息。

所述第一獲取模塊包括：采集單元，用于采集所述目標多媒體節(jié)目的音頻數(shù)據(jù)，從所述目標多媒體節(jié)目的音頻數(shù)據(jù)中獲取所述多媒體節(jié)目的音頻水印和音頻指紋；

錄制單元，用于錄制所述目標多媒體節(jié)目播放時的音頻，以獲取所述目標多媒體節(jié)目的音頻水印和音頻指紋。

本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京酷云互動科技有限公司，未經(jīng)北京酷云互動科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410012734.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

H 電學(xué)

H04 電通信技術(shù)
H04N 圖像通信，如電視
H04N21-00 可選的內(nèi)容分發(fā)，例如交互式電視，VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器，例如：VOD服務(wù)器；其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備，如STB[機頂盒]；相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理；內(nèi)容本身
H04N21-81 ..其單媒體部件

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】