[發明專利]基于音頻的場景識別方法、裝置、設備及存儲介質有效
| 申請號: | 202010215261.0 | 申請日: | 2020-03-24 |
| 公開(公告)號: | CN113450823B | 公開(公告)日: | 2022-10-28 |
| 發明(設計)人: | 邢文峰 | 申請(專利權)人: | 海信視像科技股份有限公司 |
| 主分類號: | G10L25/15 | 分類號: | G10L25/15;G10L25/03;G10L25/18;G10L25/51 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 賈敏 |
| 地址: | 266555 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 音頻 場景 識別 方法 裝置 設備 存儲 介質 | ||
1.一種基于音頻的場景識別方法,其特征在于,所述方法包括:
確定音頻的當前音頻幀包括的第一音源和第二音源,所述第一音源為帶諧波的音源,所述第二音源為不帶諧波的音源;
統計第一音源數量和第二音源數量,所述第一音源數量是指所述當前音頻幀包括的第一音源的數量,所述第二音源數量是指所述當前音頻幀包括的第二音源的數量;
根據所述第一音源數量和所述第二音源數量,確定所述當前音頻幀所對應的場景;
所述根據所述第一音源數量和所述第二音源數量,確定所述當前音頻幀所對應的場景,包括:
若所述當前音頻幀為非靜音音頻幀,確定所述第一音源數量和所述第二音源數量之和,得到所述當前音頻幀的音源總數量;若所述音源總數量小于或等于第一參考閾值,獲取靜音時長,其中,在所述當前音頻幀之前包括非靜音音頻幀的情況下,所述靜音時長是指當前音頻幀與前一個非靜音音頻幀之間包括的靜音音頻幀的總時長;在所述當前音頻幀之前不包括非靜音音頻幀的情況下,所述靜音時長是指當前音頻幀之前的所有靜音音頻幀的總時長;響應于所述靜音時長大于第二參考閾值,確定所述當前音頻幀所對應的場景為人聲場景;響應于所述靜音時長小于或等于所述第二參考閾值,若所述第一音源數量大于或等于第三參考閾值,確定所述當前音頻幀所對應的場景為綜藝場景;響應于所述靜音時長小于或等于所述第二參考閾值,若所述第一音源數量小于所述第三參考閾值,確定所述當前音頻幀所對應的場景為單樂器演奏場景;
或者,
統計每個第一音源的諧波數量;獲取所述當前音頻幀的能量總值、第一能量值和第二能量值,所述第一能量值為所述當前音頻幀中頻率高于噪聲頻率閾值的音頻頻段的能量值,所述第二能量值為所述當前音頻幀中頻率低于參考頻率閾值的音頻頻段的能量值;基于所述第一音源數量與所述第二音源數量,確定所述當前音頻幀中的第二音源的音源比例;基于每個第一音源的諧波數量、所述第一音源數量和參考諧波數量閾值,確定所述當前音頻幀的諧波數量比例;基于所述第一能量值與所述能量總值,確定所述當前音頻幀的噪聲比例;基于所述第二能量值與所述能量總值,確定所述當前音頻幀中的指定音頻的音頻比例;基于所述音源比例、所述諧波數量比例、所述噪聲比例、所述音頻比例,確定所述當前音頻幀所對應的場景。
2.如權利要求1所述的方法,其特征在于,所述確定音頻的當前音頻幀包括的第一音源和第二音源,包括:
根據所述當前音頻幀,確定所述當前音頻幀的共振峰記錄表,所述共振峰記錄表包括所述當前音頻幀的多個共振峰的三元組,所述三元組包括對應的共振峰的頻率、幅度和帶寬;
根據所述多個共振峰的三元組,確定所述當前音頻幀包括的第一音源和第二音源。
3.如權利要求2所述的方法,其特征在于,所述根據所述當前音頻幀,確定所述當前音頻幀的共振峰記錄表,包括:
將所述當前音頻幀由時域轉換到頻域,得到所述當前音頻幀的頻譜圖;
基于所述頻譜圖,確定所述當前音頻幀的多個共振峰;
以三元組的形式記錄所述多個共振峰中每個共振峰的頻率、幅度和帶寬,得到多個三元組;
將所述多個三元組進行組合,得到所述當前音頻幀的共振峰記錄表。
4.如權利要求2所述的方法,其特征在于,所述根據所述多個共振峰的三元組,確定所述當前音頻幀包括的第一音源和第二音源,包括:
將所述共振峰記錄表確定為目標共振峰記錄表;
從所述目標共振峰記錄表中確定頻率最高的共振峰,得到第一共振峰;
若所述目標共振峰記錄表中存在與所述第一共振峰對應同一音源的共振峰,將所述第一共振峰對應的音源確定為一個第一音源,若所述目標共振峰記錄表中不存在與所述第一共振峰對應同一音源的共振峰,將所述第一共振峰對應的音源確定為一個第二音源;
從所述目標共振峰記錄表中刪除與所確定的音源對應的所有共振峰的三元組;
將執行刪除操作后的共振峰記錄表確定為目標共振峰記錄表,返回所述從所述目標共振峰記錄表中確定頻率最高的共振峰的步驟,直到所述共振峰記錄表中不存在三元組為止。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海信視像科技股份有限公司,未經海信視像科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010215261.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:關聯接入點設備的方法、裝置及存儲介質
- 下一篇:電流監測系統及方法





