[發(fā)明專利]一種多媒體節(jié)目識別方法和裝置在審
| 申請?zhí)枺?/td> | 201410012734.1 | 申請日: | 2014-01-10 |
| 公開(公告)號: | CN103747277A | 公開(公告)日: | 2014-04-23 |
| 發(fā)明(設(shè)計)人: | 李鵬;陸承恩;黃曉敏;趙光玉 | 申請(專利權(quán))人: | 北京酷云互動科技有限公司 |
| 主分類號: | H04N21/233 | 分類號: | H04N21/233;H04N21/439;H04N21/462;G10L19/018 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100007 北京市東城*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多媒體 節(jié)目 識別 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及多媒體信息技術(shù)領(lǐng)域,尤其涉及一種多媒體節(jié)目識別方法和裝置。
背景技術(shù)
隨著信息技術(shù)的發(fā)展,人們可以通過多種途徑瀏覽多媒體信息,例如在線觀看視頻、電視節(jié)目等等。人們也希望能夠在瀏覽多媒體內(nèi)容的同時,獲得更多與多媒體內(nèi)容相關(guān)的信息。為了能夠獲取多媒體內(nèi)容相關(guān)的信息,首先需要對多媒體節(jié)目進行識別。
聲印碼(Audio?Watermarking?Code)是一種音頻水印技術(shù),通常是在音頻的頻譜中嵌入一段不影響人耳聽覺的信息,該信息可以從音頻文件或通過錄音設(shè)備解析出來。音頻水印可以用于版權(quán)保護,以及嵌入標題信息等。而音頻指紋是指從音頻中提取的特征信息的技術(shù),與音頻水印技術(shù)的區(qū)別的關(guān)鍵在于:水印技術(shù)是將信息嵌入到音頻中,而音頻指紋技術(shù)則是從音頻中提取特征指紋。
本發(fā)明的發(fā)明人發(fā)現(xiàn),音頻水印技術(shù)需要改變原始音頻的數(shù)據(jù),雖然對人耳聽覺感官的影響較小,但是降低了音頻的質(zhì)量,而且必須對音頻嵌入水印信息,因此降低了應(yīng)用的范圍。
而音頻指紋技術(shù)是從原始音頻中提取信息,不會對原始的音頻做任何修改,因此不影響原始音頻的質(zhì)量,其缺點是識別時間略長,一般需要大于5秒的時間,并且精度與穩(wěn)定性不如音頻水印技術(shù)。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種多媒體節(jié)目識別方法和裝置,通過音頻水印與音頻指紋相結(jié)合,達到快速而準確的音頻匹配與多媒體節(jié)目識別的目的。
為達上述目的,本發(fā)明實施例采用以下技術(shù)方案:
一種多媒體節(jié)目識別方法,所述方法包括:
獲取關(guān)于目標多媒體節(jié)目的音頻水印和音頻指紋;
將所述音頻水印與預(yù)設(shè)的音頻水印樣本進行匹配,獲得第一匹配結(jié)果,以及將所述音頻指紋與預(yù)設(shè)的音頻指紋樣本進行匹配,獲得第二匹配結(jié)果;
通過預(yù)設(shè)的混合模型合并所述第一匹配結(jié)果與所述第二匹配結(jié)果,獲得第三匹配結(jié)果;
根據(jù)所述第三匹配結(jié)果獲得所述目標多媒體節(jié)目的識別結(jié)果
通過音頻指紋與音頻水印的結(jié)合對目標多媒體節(jié)目進行音頻識別,匹配出與目標多媒體節(jié)目對應(yīng)的多媒體文件信息,達到快速而準確的音頻匹配與識別的效果。
所述方法還包括:根據(jù)所述目標多媒體節(jié)目的識別結(jié)果,獲取與所述目標多媒體節(jié)目對應(yīng)的關(guān)聯(lián)信息。以實現(xiàn)與多媒體信息相關(guān)的信息推送。
由終端設(shè)備或服務(wù)器實現(xiàn)所述方法。可以在線或離線方式進行音頻識別處理。
由終端實現(xiàn)所述方法;所述方法還包括:輸出表示是否展示關(guān)聯(lián)信息的提示信息;接收輸入的確認指令;根據(jù)收到的確認指令,展示所述關(guān)聯(lián)信息。根據(jù)用戶需求呈現(xiàn)關(guān)聯(lián)信息。
所述獲取關(guān)于目標多媒體節(jié)目的音頻水印和音頻指紋包括:采集所述目標多媒體節(jié)目的音頻數(shù)據(jù),從所述目標多媒體節(jié)目的音頻數(shù)據(jù)中獲取所述多媒體節(jié)目的音頻水印和音頻指紋,或錄制所述目標多媒體節(jié)目播放時的音頻,以獲取所述目標多媒體節(jié)目的音頻水印和音頻指。
通過預(yù)設(shè)的混合模型合并第一匹配結(jié)果與第二匹配結(jié)果,獲得第三匹配結(jié)果,包括:通過可訓(xùn)練混合模型合并第一匹配結(jié)果與第二匹配結(jié)果。有利于保持匹配結(jié)果的準確度。
一種多媒體節(jié)目識別裝置,所述裝置包括:
第一獲取模塊,用于獲取關(guān)于目標多媒體節(jié)目的音頻水印和音頻指紋;
匹配模塊,用于將所述音頻水印與預(yù)設(shè)的音頻水印樣本進行匹配,獲得第一匹配結(jié)果,以及將所述音頻指紋與預(yù)設(shè)的音頻指紋樣本進行匹配,獲得第二匹配結(jié)果;
合并模塊,用于通過預(yù)設(shè)的混合模型合并所述第一匹配結(jié)果與所述第二匹配結(jié)果,獲得第三匹配結(jié)果;
獲得模塊,根據(jù)所述第三匹配結(jié)果獲得所述目標多媒體節(jié)目的識別結(jié)果。
所述裝置還包括:第二獲取模塊,用于根據(jù)所述目標多媒體節(jié)目的識別結(jié)果,獲取與所述目標多媒體節(jié)目對應(yīng)的關(guān)聯(lián)信息。
所述裝置還包括:提示模塊,用于輸出表示是否展示關(guān)聯(lián)信息的提示信息接收模塊,用于接收輸入的確認指令;展示模塊,用于根據(jù)收到的確認指令,展示所述關(guān)聯(lián)信息。
所述第一獲取模塊包括:采集單元,用于采集所述目標多媒體節(jié)目的音頻數(shù)據(jù),從所述目標多媒體節(jié)目的音頻數(shù)據(jù)中獲取所述多媒體節(jié)目的音頻水印和音頻指紋;
錄制單元,用于錄制所述目標多媒體節(jié)目播放時的音頻,以獲取所述目標多媒體節(jié)目的音頻水印和音頻指紋。
本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京酷云互動科技有限公司,未經(jīng)北京酷云互動科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410012734.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件





