[發(fā)明專利]本體感知聲音分類在審
| 申請?zhí)枺?/td> | 202011548123.0 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN113129906A | 公開(公告)日: | 2021-07-16 |
| 發(fā)明(設(shè)計)人: | S·加法扎德甘;馮哲;孫熠瑋 | 申請(專利權(quán))人: | 羅伯特·博世有限公司 |
| 主分類號: | G10L17/26 | 分類號: | G10L17/26;G10L17/18;G10L17/00;G10L17/04;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 李雪娜;周學(xué)斌 |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 本體 感知 聲音 分類 | ||
1.一種用于本體感知聲音分類的系統(tǒng),所述系統(tǒng)包括電子處理器,所述電子處理器被配置為
基于精細(xì)音頻分類標(biāo)簽之間的關(guān)系而創(chuàng)建第一圖;
基于粗略音頻分類標(biāo)簽之間的關(guān)系而創(chuàng)建第二圖;
接收包括一個或多個聲音的音頻剪輯;
以第一圖作為輸入來執(zhí)行第一圖卷積網(wǎng)絡(luò);
以第二圖作為輸入來執(zhí)行第二圖卷積網(wǎng)絡(luò);以及
使用第一圖卷積網(wǎng)絡(luò)和第二圖卷積網(wǎng)絡(luò)的輸出來確定一個或多個粗略標(biāo)簽、一個或多個精細(xì)標(biāo)簽、或二者,以對音頻剪輯中的一個或多個聲音進(jìn)行分類。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述電子處理器被配置為確定一個或多個粗略標(biāo)簽、一個或多個精細(xì)標(biāo)簽或二者,以通過以下方式對音頻剪輯中的一個或多個聲音進(jìn)行分類
使用神經(jīng)網(wǎng)絡(luò)從音頻剪輯產(chǎn)生向量。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中所述神經(jīng)網(wǎng)絡(luò)是卷積遞歸神經(jīng)網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求2所述的系統(tǒng),其中以第一圖作為輸入來執(zhí)行第一圖卷積網(wǎng)絡(luò)的輸出是第一矩陣,并且所述電子處理器進(jìn)一步被配置為
將向量乘以第一矩陣,以產(chǎn)生被預(yù)測為與音頻剪輯相關(guān)聯(lián)的一個或多個精細(xì)標(biāo)簽。
5.根據(jù)權(quán)利要求4所述的系統(tǒng),其中所述電子處理器被配置為
以被預(yù)測為與音頻剪輯相關(guān)聯(lián)的一個或多個精細(xì)標(biāo)簽作為輸入來執(zhí)行單層前饋神經(jīng)網(wǎng)絡(luò),以產(chǎn)生與音頻剪輯相關(guān)聯(lián)的一個或多個預(yù)測的粗略標(biāo)簽。
6.根據(jù)權(quán)利要求2所述的系統(tǒng),其中以第二圖作為輸入來執(zhí)行第二圖卷積網(wǎng)絡(luò)的輸出是第二矩陣,并且所述電子處理器進(jìn)一步被配置為
將向量乘以第二矩陣,以產(chǎn)生被預(yù)測為與音頻剪輯相關(guān)聯(lián)的一個或多個粗略標(biāo)簽。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其中所述電子處理器被配置為
以被預(yù)測為與音頻剪輯相關(guān)聯(lián)的一個或多個粗略標(biāo)簽作為輸入來執(zhí)行單層前饋神經(jīng)網(wǎng)絡(luò),以產(chǎn)生與音頻剪輯相關(guān)聯(lián)的一個或多個預(yù)測的精細(xì)標(biāo)簽。
8.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述電子處理器被配置為使用多個標(biāo)記的音頻剪輯和定義聲音標(biāo)簽本體的一個或多個數(shù)據(jù)結(jié)構(gòu)來創(chuàng)建第一圖和第二圖。
9.根據(jù)權(quán)利要求1所述的系統(tǒng),其中包括在第一圖中的每個節(jié)點(diǎn)與精細(xì)標(biāo)簽相關(guān)聯(lián),并且包括在第二圖中的每個節(jié)點(diǎn)與粗略標(biāo)簽相關(guān)聯(lián),并且第一圖和第二圖二者中的邊關(guān)聯(lián)于與邊連接的節(jié)點(diǎn)相關(guān)聯(lián)的標(biāo)簽在音頻剪輯中共現(xiàn)的概率。
10.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述系統(tǒng)由從包括家庭監(jiān)視應(yīng)用、監(jiān)督應(yīng)用、自動車輛應(yīng)用和交通監(jiān)視應(yīng)用的組中選擇的至少一個使用。
11.一種用于本體感知的聲音分類的方法,該方法包括
基于精細(xì)音頻分類標(biāo)簽之間的關(guān)系而創(chuàng)建第一圖;
基于粗略音頻分類標(biāo)簽之間的關(guān)系而創(chuàng)建第二圖;
接收包括一個或多個聲音的音頻剪輯;
以第一圖作為輸入來執(zhí)行第一圖卷積網(wǎng)絡(luò);
以第二圖作為輸入來執(zhí)行第二圖卷積網(wǎng)絡(luò);以及
使用第一圖卷積網(wǎng)絡(luò)和第二圖卷積網(wǎng)絡(luò)的輸出來確定一個或多個粗略標(biāo)簽、一個或多個精細(xì)標(biāo)簽、或二者,以對音頻剪輯中的一個或多個聲音進(jìn)行分類。
12.根據(jù)權(quán)利要求11所述的方法,其中確定一個或多個粗略標(biāo)簽、一個或多個精細(xì)標(biāo)簽、或二者,以對音頻剪輯中的一個或多個聲音進(jìn)行分類包括
使用神經(jīng)網(wǎng)絡(luò)從音頻剪輯產(chǎn)生向量。
13.根據(jù)權(quán)利要求12所述的方法,其中所述神經(jīng)網(wǎng)絡(luò)是卷積遞歸神經(jīng)網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于羅伯特·博世有限公司,未經(jīng)羅伯特·博世有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011548123.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點(diǎn)和感知節(jié)點(diǎn)
- 感知無線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點(diǎn)和匯聚中心
- 感知無線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點(diǎn)
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫
- 基于認(rèn)知數(shù)據(jù)庫和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





