[發明專利]提取音頻文件的相似片段的方法及裝置在審

申請號：	202011101357.0	申請日：	2020-10-15
公開（公告）號：	CN112434263A	公開（公告）日：	2021-03-02
發明（設計）人：	徐單恒	申請（專利權）人：	杭州安存網絡科技有限公司
主分類號：	G06F21/10	分類號：	G06F21/10;G06F16/683
代理公司：	北京律和信知識產權代理事務所(普通合伙) 11446	代理人：	謝清萍;項榮
地址：	310005 浙江省杭州市***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	提取音頻文件相似片段方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種提取音頻文件的相似片段的方法，其特征在于，包括：

獲取第一音頻文件和第二音頻文件；

提取所述第一音頻文件和所述第二音頻文件的音頻信號數據，得到第一音頻信號數據和第二音頻信號數據；

分幀處理所述第一音頻信號數據和所述第二音頻信號數據，對所述第一音頻信號數據和所述第二音頻信號數據按時間分塊；

以預定的時長和步長滑動截取分幀處理后的所述第一音頻信號數據和所述第二音頻信號數據，得到第一音頻片段和第二音頻片段；

計算所述第一音頻片段和所述第二音頻片段的相似度；

根據所述相似度的結果，提取所述第一音頻文件和所述第二音頻文件中相似的音頻片段。

2.根據權利要求1所述的方法，其特征在于，在分幀處理所述第一音頻信號數據和所述第二音頻信號數據之前，還包括：

預處理所述第一音頻信號數據和所述第二音頻信號數據。

3.根據權利要求2所述的方法，其特征在于，預處理所述第一音頻信號數據和所述第二音頻信號數據，包括：

歸一化所述第一音頻信號數據和所述第二音頻信號數據；

降噪歸一化后的所述第一音頻信號數據和所述第二音頻信號數據。

4.根據權利要求3所述的方法，其特征在于，降噪歸一化后的所述第一音頻信號數據和所述第二音頻信號數據，包括：

利用窗函數，得到函數窗數據；

利用所述函數窗數據，對歸一化后的所述第一音頻信號數據和所述第二音頻信號數據分別進行卷積運算；

分別取出所述第一音頻信號數據和所述函數窗數據、所述第二音頻信號數據和所述函數窗數據卷積運算后完全重疊的區域數據。

5.根據權利要求4所述的方法，其特征在于，所述利用窗函數，得到函數窗數據，包括：

利用漢寧函數計算權重，生成漢寧窗，得到所述函數窗數據。

6.根據權利要求1所述的方法，其特征在于，計算所述第一音頻片段和所述第二音頻片段的相似度，包括：

設置音頻相似度閾值；

利用互相關函數，依次計算所述第一音頻信號數據的所述第一音頻片段和所述第一音頻信號數據的所述第二音頻片段的相似度。

比較所述相似度和所述相似度閾值的大小。

7.根據權利要求6所述的方法，其特征在于，提取所述第一音頻文件和所述第二音頻文件的相似的音頻片段，包括：

如果所述相似度大于所述相似度閾值，則分別記錄所述第一音頻片段和所述第二音頻片段的開始時間和結束時間；

按音頻片段的開始時間，分別排序所述第一音頻片段和所述第二音頻片段；

合并有相鄰或相交開始時間的所述第一音頻片段和所述第二音頻片段；

更新所述第一音頻片段和所述第二音頻片段的開始時間和結束時間；

利用更新的所述第一音頻片段和所述第二音頻片段的開始時間和結束時間，分別提取所述第一音頻文件和所述第二音頻文件的相似的音頻片段。

8.一種提取音頻文件的相似片段的裝置，其特征在于，包括：

音頻獲取模塊，用于獲取第一音頻文件和第二音頻文件；

音頻數據轉換模塊，用于提取所述第一音頻文件和所述第二音頻文件的音頻信號數據，得到第一音頻信號數據和第二音頻信號數據；

音頻分段模塊，用于以預定的幀率、時長和步長滑動截取所述第一音頻信號數據和所述第二音頻信號數據，得到第一音頻片段和第二音頻片段；

音頻相似度計算模塊，用于計算所述第一音頻片段和所述第二音頻片段的相似度；

音頻提取模塊，用于提取所述第一音頻文件和所述第二音頻文件的音頻相似片段。

9.根據權利要求8所述的裝置，其特征在于，還包括：

音頻預處理模塊，用于預處理所述第一音頻信號數據和所述第二音頻信號數據。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于杭州安存網絡科技有限公司，未經杭州安存網絡科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011101357.0/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種連續退火爐爐溫預警方法及系統
下一篇：一種銀-鈷錳層狀雙氫氧化物復合材料及其制備方法和應用

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理
G06F21-00 防止未授權行為的保護計算機或計算機系統的安全裝置
G06F21-02 .通過保護計算機的特定內部部件
G06F21-04 .通過保護特定的外圍設備，如鍵盤或顯示器
G06F21-06 .通過感知越權操作或外圍侵擾
G06F21-20 .通過限制訪問計算機系統或計算機網絡中的節點
G06F21-22 .通過限制訪問或處理程序或過程

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】