[發明專利]基于關鍵特征的大規模編目模版遷移方法及系統在審
| 申請號: | 201310628448.3 | 申請日: | 2013-11-29 |
| 公開(公告)號: | CN103699575A | 公開(公告)日: | 2014-04-02 |
| 發明(設計)人: | 陳鑫瑋;徐波 | 申請(專利權)人: | 北京中科模識科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 李迪 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 關鍵 特征 大規模 編目 模版 遷移 方法 系統 | ||
技術領域
本發明涉及計算機編目技術領域,特別涉及一種基于關鍵特征的大規模編目模版遷移方法及系統。
背景技術
傳統的遷移辦法一般為人工導入,在導入的過程中盡量從文本內容避開相同重復模版的可能性,這種遷移方法一般需要耗費很大的人工量,并且難免會有重復,因為存在大量文本描述不同,但音視頻內容卻一致的編目模版。
發明內容
(一)要解決的技術問題
本發明所要解決的技術問題是:如何提供一種基于關鍵特征的大規模編目模版遷移技術和方法,充分利用計算機音視頻關鍵特征比對技術,實現在少量人工參與的情況下,計算機自動對大規模的編目模版進行遷移案。
(二)技術方案
為解決上述問題,本發明提供一種基于關鍵特征的大規模編目模版遷移方法,包括步驟:S1、分別從待遷移的編目模版庫與目標編目模版庫中獲取音視頻模版,兩兩基于音視頻的關鍵特征進行音視頻內容的比對;S2、經過音視頻內容的比對,若待遷移的模版在目標庫中已存在,即在目標庫中存在完全相同音視頻內容的編目模版,那么計算機自動將該模版丟棄,不予遷移;若待遷移的模版在目標庫中不存在,即在目標庫中找不到與其音視頻內容相同或部分相同的編目模版,則計算機自動將該模版遷移到目標編目模版庫中;若在目標庫中找到有部分音視頻內容與待遷移的編目模版相同時,則自動將其標記分組,同時轉入步驟S3;S3、由處理分組好的編目模版,即有音視頻內容部分重疊的模版組,根據具體的業務需要,排除無效的編目模版,剩余的有效編目模版計算機將自動遷移入目標編目模版庫。
本發明還提供一種基于關鍵特征的大規模編目模版遷移系統,包括:音視頻關鍵特征比對模塊,通過該模塊,計算機自動抽取待遷移模版與目標庫中的已有模版中的音視頻關鍵特征,并對模版中的音視頻內容進行自動比對;編目模版分組模塊,通過該模塊,計算機自動根據模版關鍵特征的比對結果對待遷移的模版進行分組,將其分為:完全相同、完全不同、部分相同3組模版,并進行標識;人工審核界面模塊,該模塊提供人機交互界面,人工可通過該界面對與目標庫中模版部分相同的待遷移模版進行審核,人工可回放待遷移模版與目標庫中模版相同部分的音視頻,根據不同的業務需要,決定該待遷移模版是否為有效模版,即是否該遷移入庫;編目模版遷移模塊,通過該模塊,計算機自動匯總有效的新的待遷移模版,并將模版所對應的音視頻文件,以及文本描述信息入目標庫。
優選地,所述音視頻關鍵特征比對模塊的工作流程包括:a、獲取待遷移模版中的音頻信號,進行預處理,即提取功率譜并計算子帶能量,建立能量直方圖,得到音頻指紋,即音頻關鍵特征;b、獲取目標模版庫中模版的音頻信號,進行預處理,即加窗提取功率譜,并計算子帶能量,建立能量直方圖,得到音頻關鍵特征;c、根據兩個模版的音頻關鍵特征,進行模版比對,計算兩個模版的相似度,最后根據人工預設的門限值,決策該兩個模版是否相同、部分相同或完全不同。
優選地,所述編目模版分組模塊的工作流程包括:自動將完全相同的待遷移模版丟棄,完全不同的模版即為新模版,自動傳送給編目模版遷移模塊進行遷移入目標庫,而對于部分相同的模版則傳送給人工審核界面模塊。
優選地,所述人工審核界面模塊的工作流程包括:人工可通過該界面對待遷移模版進行編輯裁剪為有效模版后再遷移入庫。
(三)有益效果
根據本發明,能夠很好地解決傳統方法耗費人力、速度慢,而且容易存在重復內容的編目模版的缺點,能夠在少量人工參與的情況下通過計算機自動進行編目模版的遷移,同時在遷移過程中真正避免重復模版的情況出現。
附圖說明
圖1為依照本發明實施例的基于關鍵特征的大規模編目模版遷移方法的流程示意圖;
圖2為依照本發明實施例的基于關鍵特征的大規模編目模版遷移系統的結構示意圖;
圖3為依照本發明實施例的音視頻關鍵特征比對模塊的工作流程示意圖。
具體實施方式
下面結合附圖和實施例,對本發明的具體實施方式作進一步詳細描述。以下實施例用于說明本發明,但不用來限制本發明的范圍。
如圖1所示,根據本發明實施例的基于關鍵特征的大規模編目模版遷移方法包含以下步驟:
步驟S1:分別從待遷移的編目模版庫與目標編目模版庫中獲取音視頻模版,兩兩基于音視頻的關鍵特征進行音視頻內容的比對,在本方法中,關鍵特征可看作是這一小段音頻數據本身的一個短小的總結,通過數學函數的映射,可將數據冗余較大的音頻波形空間映射到指紋空間,從而在比對過程中定位相似或相同的音頻內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科模識科技有限公司,未經北京中科模識科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310628448.3/2.html,轉載請聲明來源鉆瓜專利網。





