[發(fā)明專利]錄制媒體的信號(hào)偵測(cè)方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210532231.8 | 申請(qǐng)日: | 2012-12-11 |
| 公開(kāi)(公告)號(hào): | CN103065661A | 公開(kāi)(公告)日: | 2013-04-24 |
| 發(fā)明(設(shè)計(jì))人: | 廖宜斌;張國(guó)韋;呂仲理;蘇家輝;曾新穆 | 申請(qǐng)(專利權(quán))人: | 中華電信股份有限公司 |
| 主分類號(hào): | G11B27/10 | 分類號(hào): | G11B27/10;G06F17/30 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 王茹;曾旻輝 |
| 地址: | 中國(guó)臺(tái)灣桃*** | 國(guó)省代碼: | 中國(guó)臺(tái)灣;71 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 錄制 媒體 信號(hào) 偵測(cè) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明是關(guān)于一種在錄制媒體中信號(hào)偵測(cè)的方法,特別為一種利用信號(hào)處理與比對(duì)技術(shù),將錄制的信號(hào)與內(nèi)容提供商所提供的信號(hào)相互比對(duì),自動(dòng)偵測(cè)相似片段的方法。
背景技術(shù)
隨著科技進(jìn)步,多媒體信息已成為我們生活的重心,在多媒體搜尋這個(gè)議題上,如何快速地響應(yīng)使用者的需求一直都是熱門的研究主題,特別是在這個(gè)信息爆炸的年代,信息量更以倍數(shù)的速度成長(zhǎng),如果單靠人工方式進(jìn)行搜尋,既耗時(shí)又費(fèi)力。因此我們希望利用數(shù)據(jù)索引技術(shù),從原本雜亂無(wú)章的數(shù)據(jù)中,萃取出與使用者興趣相近的內(nèi)涵特征,進(jìn)而達(dá)到快速而有效的檢索搜尋。
目前多媒體數(shù)據(jù)的檢索技術(shù),主要是以多媒體本身的文字信息作為判斷,在先前的專利技術(shù)中有提及類似的概念:臺(tái)灣DigitalInn公開(kāi)號(hào)200307874,此專利是一種方法與系統(tǒng),其使用便攜設(shè)備,將音檔上傳服務(wù)器,利用其音頻指紋辨識(shí)音文件內(nèi)容并比對(duì)搜尋數(shù)據(jù)庫(kù)內(nèi)相同的音文件,然而該專利中,音頻指紋只限于一首歌曲被播出的時(shí)間、地區(qū)等周邊文字信息,并不包括音樂(lè)本身擷取出的音頻信息。
另外文獻(xiàn)中也有利用音頻信息的方法,如Microsoft臺(tái)灣專利號(hào):I329455是一種自多媒體串流中辨識(shí)和擷取重復(fù)聲音或視訊對(duì)象的系統(tǒng)與方法,使用自我相關(guān)系數(shù)做為辨識(shí)準(zhǔn)則,然而該專利不包括加速搜尋的索引技術(shù),且用于比對(duì)的音樂(lè)特征如BPM以及Bark?Spectra應(yīng)該無(wú)法有效辨識(shí)音樂(lè)片段。又如HP專利美國(guó)專利號(hào)6995309,是一種用于音樂(lè)識(shí)別的系統(tǒng)與方法,錄制音樂(lè)樣本,產(chǎn)生該樣本的特征向量,與曲庫(kù)中的音樂(lè)特征向量,一同計(jì)算特征差異,若符合歌曲匹配規(guī)則,則提供歌曲信息給用戶。本篇專利重在其匹配比對(duì)方法,使用FFT重迭存取卷積及夾角余弦公式計(jì)算;至于特征抽取方法則不在專利宣告范圍內(nèi);Dolby專利美國(guó)專利號(hào)US20100205174,是一種使用多個(gè)搜尋組合改良音頻/視訊指紋搜尋正確性的技術(shù)。
針對(duì)音頻/視訊片段,取得其指紋特征,并在數(shù)據(jù)庫(kù)中搜尋指紋以獲得可能的匹配。指紋之間差值測(cè)量的方法,有漢明距離、位錯(cuò)誤率、Lp范數(shù)、L2距離、自相關(guān)系數(shù)等,若有符合,則反饋搜尋成功信息給用戶,若不符合,則會(huì)反饋搜尋結(jié)果沒(méi)有存在數(shù)據(jù)庫(kù)中。前述兩篇專利的缺點(diǎn)為數(shù)學(xué)運(yùn)算多,計(jì)算量大,反饋速度較慢。此外GraceNote專利US7,549,051B2以訊號(hào)的Time-Frequencycomponents的一階變化為基礎(chǔ)的音頻指紋建立索引與pattern?match;Shazam專利US2009/0265174A9以訊號(hào)Time-Frequency?landmarks為基礎(chǔ)并產(chǎn)生頻率峰值對(duì)的invariant/variant兩種哈希數(shù)值,搜尋時(shí)先比對(duì)invariant?pattern找出所有可能的頻率峰值對(duì)再運(yùn)用相對(duì)時(shí)間偏移的histogram統(tǒng)計(jì)找出有線性關(guān)系(histogram?peak)的音樂(lè)。
前述兩篇專利皆只能用于音樂(lè)檔案,無(wú)法處理多媒體影片。
由此可見(jiàn),上述傳統(tǒng)方式仍有許多不足,不是一個(gè)完善的設(shè)計(jì),而亟待加以改良。
發(fā)明內(nèi)容
隨著壓縮方式快速發(fā)展,數(shù)字內(nèi)容已成為生活中的一部份,在這樣的環(huán)境下,經(jīng)常會(huì)發(fā)生我們對(duì)某些內(nèi)容很感興趣、卻無(wú)法使用傳統(tǒng)關(guān)鍵詞搜尋的方法來(lái)找出該內(nèi)容的信息。而利用錄制媒體搜尋的方式可以在這種情形下達(dá)到搜尋該數(shù)字內(nèi)容的目標(biāo)。例如:當(dāng)我們聽(tīng)到一首很感興趣的音樂(lè),但卻又不曉得任何有關(guān)該音樂(lè)的信息,這時(shí)可以利用錄音裝置記錄音樂(lè)片段,然后利用搜尋系統(tǒng)對(duì)這段音樂(lè)進(jìn)行特征值分析,進(jìn)而找出其低階特征值,之后利用這些低階特征值找出在音樂(lè)數(shù)據(jù)庫(kù)中最有可能包括該音樂(lè)片段的音樂(lè),如此一來(lái)即使我們無(wú)法對(duì)該音樂(lè)下關(guān)鍵詞,系統(tǒng)也可以依照音樂(lè)本身的特性進(jìn)而完成搜尋的工作。
本發(fā)明的目的即在于提出一種錄制媒體的信號(hào)偵測(cè)的方法,可應(yīng)用于行動(dòng)裝置上,通過(guò)錄音錄像的方式找尋相似的歌曲或電影;也可應(yīng)用于電子儲(chǔ)存設(shè)備中,自動(dòng)分析及標(biāo)記及整理數(shù)字內(nèi)容。
達(dá)成上述發(fā)明目的的錄制媒體信號(hào)偵測(cè)方法,將內(nèi)容提供商所提供的信號(hào)內(nèi)容信息進(jìn)行特征抽取、分群并建立索引,當(dāng)用戶想要查詢某個(gè)媒體信號(hào)時(shí),可錄制與分析媒體裝置的信號(hào)內(nèi)容,進(jìn)行特征抽取并求出每個(gè)特征和內(nèi)容提供商的群中心的間的距離,取最小的距離的群作為代表,接著利用索引文件找出該代表所對(duì)應(yīng)的內(nèi)容位置,計(jì)算錄制的信號(hào)內(nèi)容與那位置附近的內(nèi)容相似度,以判斷出最相似的信號(hào)內(nèi)容片段。
本發(fā)明提供一種錄制媒體的信號(hào)偵測(cè)方法,與其他傳統(tǒng)技術(shù)相互比較時(shí),具備下列優(yōu)點(diǎn):
1.可自動(dòng)處理多媒體內(nèi)容,產(chǎn)生多媒體索引;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中華電信股份有限公司,未經(jīng)中華電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210532231.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G11B 基于記錄載體和換能器之間的相對(duì)運(yùn)動(dòng)而實(shí)現(xiàn)的信息存儲(chǔ)
G11B27-00 編輯;索引;尋址;定時(shí)或同步;監(jiān)控;磁帶行程的測(cè)量
G11B27-02 .編輯,例如,改變記錄在記錄載體上或從記錄載體上重現(xiàn)的信息信號(hào)的次序
G11B27-10 .索引;尋址;定時(shí)或同步;磁帶行程的測(cè)量
G11B27-36 .監(jiān)控;即監(jiān)控記錄或重現(xiàn)的進(jìn)程
G11B27-11 ..利用在記錄載體上檢測(cè)不到的信息的
G11B27-19 ..利用在記錄載體上可檢測(cè)到的信息的
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 亮度信號(hào)/色信號(hào)分離裝置和亮度信號(hào)/色信號(hào)分離方法
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置
- 雙耳信號(hào)的信號(hào)生成
- 雙耳信號(hào)的信號(hào)生成
- 信號(hào)處理裝置、信號(hào)處理方法、信號(hào)處理程序
- USBTYPEC信號(hào)轉(zhuǎn)HDMI信號(hào)的信號(hào)轉(zhuǎn)換線
- 信號(hào)盒(信號(hào)轉(zhuǎn)換)
- 信號(hào)調(diào)制方法、信號(hào)調(diào)制裝置、信號(hào)解調(diào)方法和信號(hào)解調(diào)裝置





