[發明專利]本體感知聲音分類在審
| 申請號: | 202011548123.0 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN113129906A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | S·加法扎德甘;馮哲;孫熠瑋 | 申請(專利權)人: | 羅伯特·博世有限公司 |
| 主分類號: | G10L17/26 | 分類號: | G10L17/26;G10L17/18;G10L17/00;G10L17/04;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 李雪娜;周學斌 |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 本體 感知 聲音 分類 | ||
一個本體感知聲音分類的系統。該系統包括電子處理器,該電子處理器被配置為基于精細音頻分類標簽之間的關系而創建第一圖,以及基于粗略音頻分類標簽之間的關系而創建第二圖。電子處理器還被配置為接收包括一個或多個聲音的音頻剪輯,以第一圖作為輸入來執行第一圖卷積網絡,以及以第二圖作為輸入來執行第二圖卷積網絡。使用第一圖卷積網絡和第二圖卷積網絡的輸出,電子處理器被配置為確定一個或多個粗略標簽、一個或多個精細標簽、或二者,以對音頻剪輯中的一個或多個聲音進行分類。
背景技術
本體是領域內對象的類或類型的形式結構。本體使得機器學習算法能夠在已知的上下文中處理數據。
發明內容
開發具有類似于人類聽覺的能力的音頻分類系統是正在增長的研究領域。與當前現有的音頻分類系統不同,人類能夠將模糊的聲音和重疊的聲音二者分類成抽象的概念或類別。這使得人類能夠消除聲音的歧義,并且理解其中聲音發源的環境。例如,人類可以將叫喊和嬰兒啼哭分類為人類聲音的子類別(類別)。人類可以將汽車喇叭分類為街道聲音的一般類別的成員或汽車聲音的更特定類別的成員。
為了填補人類和機器聲音分類能力之間的空白,除其它事物之外,本文中所描述的實施例尤其用聲音標簽或類型以及類別聲音標簽或類型的本體結構來擴大聲音分類模型。
在音頻領域中以本體的形式合并標簽之間的關系一般是非平凡的任務,因為音頻標簽不存在內在的圖結構。然而,當音頻領域的本體在音頻分類中被利用時,存在多個益處。在音頻領域中利用本體的音頻分類系統能夠消除聲音類似但語義不同的音頻類的歧義。當特定分類類別之間的區別最小時,在音頻領域中利用本體的音頻分類系統也能夠在一般類別中對聲音進行分類。在多標簽分類的情況下(例如,包括多于一個要分類的聲音的音頻剪輯),在音頻領域中利用本體的音頻分類系統能夠使用聲音在現實世界中共現的可能性來更好地對重疊聲音進行分類。
一個實施例提供了本體感知聲音分類的示例系統。該系統包括電子處理器,所述電子處理器被配置為基于精細音頻分類標簽之間的關系而創建第一圖,以及基于粗略音頻分類標簽之間的關系而創建第二圖。電子處理器還被配置為接收包括一個或多個聲音的音頻剪輯,以第一圖作為輸入執行第一圖卷積網絡,以及以第二圖作為輸入執行第二圖卷積網絡。使用第一圖卷積網絡和第二圖卷積網絡的輸出,電子處理器被配置為確定一個或多個粗略標簽、一個或多個精細標簽、或二者,以對音頻剪輯中的一個或多個聲音進行分類。
另一實施例提供了本體感知聲音分類的示例方法。該方法包括基于精細音頻分類標簽之間的關系而創建第一圖,以及基于粗略音頻分類標簽之間的關系而創建第二圖。該方法還包括接收包括一個或多個聲音的音頻剪輯,以第一圖作為輸入執行第一圖卷積網絡,以及以第二圖作為輸入執行第二圖卷積網絡。該方法還包括使用第一圖卷積網絡和第二圖卷積網絡的輸出來確定一個或多個粗略標簽、一個或多個精細標簽、或二者,以對音頻剪輯中的一個或多個聲音進行分類。
通過考慮詳細描述和附圖,其它方面、特征和實施例將變得顯而易見。
附圖說明
圖1是根據一個實施例的用于本體感知聲音分類的示例系統的框圖。
圖2是根據一個實施例的使用圖1的系統進行本體感知聲音分類的方法的示例流程圖。
圖3是根據一個實施例的使用與標簽相關聯的本體來生成標簽圖的圖形圖示。
圖4是根據一個實施例的用于本體感知聲音分類的機器學習算法的圖形圖示。
具體實施方式
在詳細解釋任何實施例之前,應該理解的是,本公開不意圖將其應用限制于在以下描述中闡述的或在以下附圖中圖示的構造細節和組件布置。實施例能夠具有其它配置,并且能夠以各種方式實踐或執行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅伯特·博世有限公司,未經羅伯特·博世有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011548123.0/2.html,轉載請聲明來源鉆瓜專利網。





