[發明專利]多人聲音頻處理方法、裝置、設備及可讀存儲介質在審
| 申請號: | 202010401608.0 | 申請日: | 2020-05-13 |
| 公開(公告)號: | CN111640450A | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 黃族良;陳昊亮 | 申請(專利權)人: | 廣州國音智能科技有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L25/18;G10L25/21;G10L25/30;G06N3/08;G06N3/04;G06F40/30;G06F40/289 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 陳文斌 |
| 地址: | 510000 廣東省廣州市黃埔*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 人聲 音頻 處理 方法 裝置 設備 可讀 存儲 介質 | ||
1.一種多人聲音頻處理方法,其特征在于,所述多人聲音頻處理方法包括:
獲取待檢測音頻,根據預設時間間隔將所述待檢測音頻分為多個音頻片段,其中,待檢測音頻包含多人聲部分與單人聲部分;
獲取多個音頻片段對應的多個特征信息,根據預設多人聲特征條件與所述多個特征信息識別所述多個音頻片段中的初始多人聲段落;
獲取所述初始多人聲段落的語義識別結果,根據所述語義識別結果確定并分離所述初始多人聲段落中的目標多人聲段落。
2.如權利要求1所述的多人聲音頻處理方法,其特征在于,所述特征信息為頻域信息,所述預設多人聲特征條件為多人聲頻域條件,所獲取多個音頻片段對應的多個特征信息,根據預設多人聲特征條件與所述多個特征信息識別所述多個音頻片段中的初始多人聲段落的步驟包括:
將所述多個音頻片段進行傅里葉變換,獲取所述多個頻域信息;
分別判斷所述多個頻域信息中的最大頻域幅值是否滿足所述預設多人聲頻域條件;
若滿足,則將當前的最大頻域幅值對應的音頻片段作為初始多人聲段落;
在所述分別判斷所述多個頻域信息中的最大頻域幅值是否滿足所述預設多人聲頻域條件的步驟之后,還包括:
若不滿足,則將當前的最大頻域幅值對應的音頻片段作為單人聲段落。
3.如權利要求2所述的多人聲音頻處理方法,其特征在于,所述分別判斷所述多個頻域信息中的最大頻域幅值是否滿足所述預設多人聲頻域條件的步驟包括:
分別判斷所述多個頻域信息中的最大頻域幅值按照時序與之前或之后的頻域信息的最大頻域幅值均值之間的差值是否超出預設閾值;
若超出預設閾值,則判定所述最大頻域幅值滿足所述預設多人聲頻域條件;
若未超出預設閾值,則判定所述最大頻域幅值不滿足所述預設多人聲頻域條件。
4.如權利要求1所述的多人聲音頻處理方法,其特征在于,所述獲取所述初始多人聲段落的語義識別結果,根據所述語義識別結果確定并分離所述初始多人聲段落中的目標多人聲段落的步驟包括:
將所述初始多人聲段落輸入預設語義識別模型,獲取所述語義識別結果;
根據所述語義識別結果確定所述初始多人聲段落中的語義分割點;
將語義分割點所劃分的語音段落作為所述目標多人聲段落,并從所述初始多人聲段落中分離出所述目標多人聲段落。
5.如權利要求4所述的多人聲音頻處理方法,其特征在于,所述獲取待檢測音頻,根據預設時間間隔將所述待檢測音頻分為多個音頻片段的步驟之前,還包括:
將預設文本數據進行分詞處理,獲取所述預設文本數據中詞語的屬性序列;
對所述屬性序列進行向量化處理,獲取所述屬性序列對應的詞向量;
將所述詞向量與對應的文本數據的文本向量進行拼接,生成輸入數據;
將所述輸入數據與對應的語義輸入結果作為訓練數據集進行訓練,獲取所述預設語義識別模型。
6.如權利要求1所述的多人聲音頻處理方法,其特征在于,所述根據所述多人聲段落與所述音頻片段的語義識別結果,確定并分離所述音頻片段中的目標多人聲段落的步驟之后,還包括:
將分離出所述目標多人聲段落后的音頻片段按照時間順序進行拼接,生成目標單人聲音頻。
7.如權利要求1-6中任一項所述的多人聲音頻處理方法,其特征在于,所述獲取待檢測音頻,根據預設時間間隔將所述待檢測音頻分為多個音頻片段的步驟之前,還包括:
獲取初始音頻,使用預設卷積神經網絡模型對所述初始音頻進行降噪處理,生成所述待檢測音頻。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州國音智能科技有限公司,未經廣州國音智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010401608.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:消費旅居養老健康管理系統
- 下一篇:一種鍋爐群組調度優化方法及裝置





