[發明專利]錄制媒體的信號偵測方法無效
| 申請號: | 201210532231.8 | 申請日: | 2012-12-11 |
| 公開(公告)號: | CN103065661A | 公開(公告)日: | 2013-04-24 |
| 發明(設計)人: | 廖宜斌;張國韋;呂仲理;蘇家輝;曾新穆 | 申請(專利權)人: | 中華電信股份有限公司 |
| 主分類號: | G11B27/10 | 分類號: | G11B27/10;G06F17/30 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 王茹;曾旻輝 |
| 地址: | 中國臺灣桃*** | 國省代碼: | 中國臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 錄制 媒體 信號 偵測 方法 | ||
1.一種錄制媒體的信號偵測方法,其特征在于,通過錄制多媒體信號內容,進行分析與處理,搜尋相似多媒體片段,所述信號偵測方法至少包括相連接的多媒體索引建立方法與錄制媒體索引比對方法。
2.根據權利要求1所述的錄制媒體的信號偵測方法,其特征在于,所述多媒體索引建立方法包括步驟:
a.時序分割,將N個多媒體檔案,編號1~N,按照時間順序分割成長度為若干秒的多媒體片段,各個多媒體片段都命名為所述多媒體檔案編號加上底線及一個時間片段序號,所述時間片段序號為所述多媒體片段開頭在源文件中是第幾秒;
b.特征抽取,步驟a.所述多媒體片段若為視訊,則抽取960個維度的場景導向特征(GIST);所述多媒體片段若為音訊,則抽取13維度的梅爾頻率倒頻譜特征(MFCC);
c.特征編碼,步驟b.中每一多媒體片段所抽取的特征,與其后一多媒體片段所抽取的特征,每一維度的差異進行二元化編碼,若兩者差異大于0則編碼成1,否則編碼成0,故若多媒體片段為視訊,則每一多媒體片段將會有960個維度0或是1,若多媒體片段為音頻,則每一多媒體片段有13個維度0或是1,以下稱為特征編碼;以及
d.建立索引。
3.根據權利要求2所述的錄制媒體的信號偵測方法,其特征在于,步驟d所述建立索引為建立出多媒體索引,即依據所述特征編碼,將所述特征編碼利用分群演算法分群并取得群中心,將每個所述特征編碼所對應的所述多媒體檔案編號與所述時間片段序號,紀錄在距離所述二元化編碼最接近的群中心的索引中。
4.根據權利要求3所述的錄制媒體的信號偵測方法,其特征在于,其中,所述分群演算法為使用非監督式分群法,給定所述群中心的個數為總共的多媒體個數開根號。
5.根據權利要求3所述的錄制媒體的信號偵測方法,其特征在于,所述距離的計算為依據漢明距離或歐式距離。
6.根據權利要求1所述的錄制媒體的信號偵測方法,其特征在于,所述錄制媒體索引比對方法,包括步驟:
a.時序分割,將多媒體檔案按照時間順序分割成長度為若干秒的多媒體片段,各個多媒體片段都命名為一個時間片段序號,所述時間片段序號為所述多媒體片段開頭在源文件中是第幾秒;
b.特征抽取,步驟a.的所述多媒體片段若為視訊,則抽取960個維度的場景導向特征(GIST);所述多媒體片段若為音訊,則抽取13維度的梅爾頻率倒頻譜特征(MFCC);
c.特征編碼,將b.中每一多媒體片段所抽取的特征,與其后一多媒體片段所抽取的特征,每一維度的差異進行二元化編碼,若兩者差異大于0則編碼成1,否則編碼成0,故若多媒體片段為視訊,則每一多媒體片段將會有960個維度0或是1,若多媒體片段為音頻,則每一多媒體片段有13個維度0或是1,以下稱為特征編碼。
d.索引比對。
7.根據權利要求6所述的錄制媒體的信號偵測方法,其特征在于,步驟d所述索引比對是將每一片段的所述特征編碼,逐一與群中心相比,找出與所述特征編碼距離最相近的群中心,接著對于所述群中心索引中包括的對應多媒體文件名及時間片段,個別求出錄制媒體內容特征與所述時間片段的特征的距離,距離最小的片段即為最相似的多媒體片段。
8.根據權利要求7所述的錄制媒體的信號偵測方法,其特征在于,其中步驟d所述索引比對提出距離的計算是依據漢明距離或歐式距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中華電信股份有限公司,未經中華電信股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210532231.8/1.html,轉載請聲明來源鉆瓜專利網。





