[發(fā)明專利]掩碼估計(jì)裝置、掩碼估計(jì)方法以及記錄介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201680081856.3 | 申請(qǐng)日: | 2016-12-20 |
| 公開(公告)號(hào): | CN108701468B | 公開(公告)日: | 2023-06-02 |
| 發(fā)明(設(shè)計(jì))人: | 伊藤信貴;荒木章子;中谷智廣 | 申請(qǐng)(專利權(quán))人: | 日本電信電話株式會(huì)社 |
| 主分類號(hào): | G10L21/0272 | 分類號(hào): | G10L21/0272;G10L21/028;G10L21/0308 |
| 代理公司: | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 黃綸偉;金玲 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 掩碼 估計(jì) 裝置 方法 以及 記錄 介質(zhì) | ||
掩碼估計(jì)裝置(10)的特征提取部(11)從將多個(gè)音頻信號(hào)在不同位置觀測(cè)的多個(gè)觀測(cè)信號(hào),提取將觀測(cè)信號(hào)的時(shí)間頻率成分按照每個(gè)時(shí)間頻率點(diǎn)匯集的特征量向量。掩碼更新部(12)根據(jù)特征量向量、將特征量向量的概率分布通過由多個(gè)元素分布構(gòu)成的混合分布進(jìn)行模型化時(shí)的各元素分布的混合權(quán)重、作為可以控制各元素分布的形狀的模型參數(shù)的形狀參數(shù),估計(jì)表示對(duì)于各時(shí)間頻率點(diǎn)的各元素分布做出貢獻(xiàn)的比例的掩碼?;旌蠙?quán)重更新部(13)根據(jù)被更新的掩碼,更新混合權(quán)重。參數(shù)更新部(14)利用特征量向量和掩碼,更新形狀參數(shù)。
技術(shù)領(lǐng)域
本發(fā)明涉及掩碼估計(jì)裝置、掩碼估計(jì)方法以及記錄介質(zhì)。
背景技術(shù)
公開有根據(jù)由多個(gè)麥克風(fēng)取得的觀測(cè)信號(hào)估計(jì)目標(biāo)聲音時(shí)采用的估計(jì)表示各時(shí)間頻率點(diǎn)中的各音頻信號(hào)的貢獻(xiàn)度的掩碼的技術(shù)。掩碼用于觀測(cè)信號(hào)的噪聲去除和聲源分離等。
例如,著眼于各音頻信號(hào)的到來方向彼此不同的情況,公開有對(duì)特征量向量進(jìn)行聚類,從而估計(jì)掩碼的技術(shù),其中,特征量表示在各時(shí)間頻率點(diǎn)中各音頻信號(hào)的聲音從哪個(gè)方向到達(dá)的信息。
先行技術(shù)文獻(xiàn)
非專利文獻(xiàn)
非專利文獻(xiàn)1:M.Souden,S.Araki,K.Kinoshita,T.Nakatani,and?H.Sawada,“AMultichannel?MMSE-Based?Framework?for?Speech?Source?Separation?and?NoiseReduction,”IEEE?TRANSACTIONS?ON?AUDIO,SPEECH?AND?LANGUAGE?PROCESSING,VOL.21,NO.9,SEPTEMBER?2013,pp.1913-1928.
發(fā)明內(nèi)容
發(fā)明要解決的課題
但是,根據(jù)上述技術(shù),通過更新將特征量向量模型化的混合分布的位置參數(shù)以及擴(kuò)展參數(shù),從而調(diào)整混合分布的元素分布的位置以及擴(kuò)展。因此,元素分布只能表示關(guān)于某個(gè)軸旋轉(zhuǎn)對(duì)稱的分布形狀。特征量向量的分布形狀受到麥克風(fēng)位置或音頻空間的傳遞特性等各種影響,不一定是旋轉(zhuǎn)對(duì)稱的,有時(shí)變成例如橢圓形的分布形狀。因此,根據(jù)上述技術(shù),無法使得混合分布充分地接近特征量向量的分布,存在掩碼估計(jì)的精度不一定很高的問題。
本申請(qǐng)公開的實(shí)施方式的一例是鑒于上述問題做出的,其目的在于提供例如進(jìn)一步提高掩碼估計(jì)的精度的掩碼估計(jì)裝置、掩碼估計(jì)方法以及掩碼估計(jì)程序。
用于解決課題的手段
在本申請(qǐng)的實(shí)施方式的一例中,例如,掩碼估計(jì)裝置在多個(gè)音頻信號(hào)混合存在的狀態(tài)下,從在不同位置取得的多個(gè)觀測(cè)信號(hào),提取將觀測(cè)信號(hào)的時(shí)間頻率成分按照每個(gè)時(shí)間頻率點(diǎn)匯集的特征量向量。掩碼估計(jì)裝置利用特征量向量、將特征量向量的概率分布利用由多個(gè)元素分布構(gòu)成的混合分布進(jìn)行模型化時(shí)的各元素分布的混合權(quán)重、作為可以控制各元素分布的形狀的模型參數(shù)的形狀參數(shù),更新表示各元素分布對(duì)于各時(shí)間頻率點(diǎn)的貢獻(xiàn)的比例的掩碼。掩碼估計(jì)裝置根據(jù)被更新的掩碼,更新混合權(quán)重。掩碼估計(jì)裝置根據(jù)特征量向量和掩碼,更新形狀參數(shù)。
發(fā)明效果
根據(jù)本申請(qǐng)公開的實(shí)施方式的一例,即使在例如特征量向量的分布不是旋轉(zhuǎn)對(duì)稱的情況下,也可以實(shí)現(xiàn)高精度的掩碼估計(jì)。
附圖說明
圖1是根據(jù)實(shí)施方式1(實(shí)施方式2)的掩碼估計(jì)裝置的一例示意圖。
圖2是示出根據(jù)實(shí)施方式1(實(shí)施方式2)的掩碼估計(jì)處理的一例的流程圖。
圖3是根據(jù)實(shí)施方式3的目標(biāo)聲音估計(jì)系統(tǒng)的一例示意圖。
圖4是示出根據(jù)實(shí)施方式3的目標(biāo)聲音估計(jì)處理的一例的流程圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于日本電信電話株式會(huì)社,未經(jīng)日本電信電話株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680081856.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種集群系統(tǒng)中長(zhǎng)碼掩碼的生成方法
- 正交掩碼生成裝置和方法及正交掩碼映射裝置和方法
- 打包數(shù)據(jù)操作掩碼比較處理器、方法、系統(tǒng)
- 用于獨(dú)立數(shù)據(jù)上遞歸計(jì)算的向量化的讀和寫掩碼更新指令
- 用于合并操作掩碼的未經(jīng)掩碼元素的裝置、方法、系統(tǒng)和制品
- 一種掩碼處理方法及客戶端
- DES軟件防DPA攻擊的方法及裝置
- 一種對(duì)數(shù)據(jù)庫信息進(jìn)行動(dòng)態(tài)掩碼的方法及系統(tǒng)
- 用于獨(dú)立數(shù)據(jù)上遞歸計(jì)算的向量化的讀和寫掩碼更新指令
- 聯(lián)邦學(xué)習(xí)隱私數(shù)據(jù)處理方法、設(shè)備、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種信道估計(jì)方法和裝置
- 基于時(shí)頻聯(lián)合的載波頻偏估計(jì)方法
- 基于改進(jìn)卡爾曼濾波的變參數(shù)迭代估計(jì)方法
- 電機(jī)驅(qū)動(dòng)系統(tǒng)以及電機(jī)控制裝置
- 意圖估計(jì)裝置和意圖估計(jì)方法
- 分布式驅(qū)動(dòng)電動(dòng)汽車路面自適應(yīng)縱向車速估計(jì)系統(tǒng)及方法
- 一種分布式驅(qū)動(dòng)電動(dòng)汽車路面附著系數(shù)估計(jì)系統(tǒng)
- 視線估計(jì)方法、終端及存儲(chǔ)介質(zhì)
- 一種SNR估計(jì)方法及其估計(jì)系統(tǒng)
- 估計(jì)車輛載荷的方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





