[發(fā)明專利]語音處理裝置、方法和程序無效
| 申請?zhí)枺?/td> | 201310018393.4 | 申請日: | 2013-01-18 |
| 公開(公告)號: | CN103226952A | 公開(公告)日: | 2013-07-31 |
| 發(fā)明(設(shè)計)人: | 本間弘幸;知念徹 | 申請(專利權(quán))人: | 索尼公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/48 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所 11038 | 代理人: | 王莉莉 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 處理 裝置 方法 程序 | ||
1.一種語音處理裝置,包括:
特征量計算部分,從輸入語音信號的目標(biāo)幀中提取特征量;
聲壓估計候選點(diǎn)更新部分,使輸入語音信號的多個幀的每個成為聲壓估計候選點(diǎn),保持每個聲壓估計候選點(diǎn)的特征量,并且基于聲壓估計候選點(diǎn)的特征量和目標(biāo)幀的特征量,來更新聲壓估計候選點(diǎn);
聲壓估計部分,基于聲壓估計候選點(diǎn)的特征量,計算輸入語音信號的估計聲壓;
增益計算部分,基于估計聲壓,計算應(yīng)用于輸入語音信號的增益;以及
增益應(yīng)用部分,基于增益,執(zhí)行輸入語音信號的增益調(diào)節(jié)。
2.根據(jù)權(quán)利要求1所述的語音處理裝置,
其中,特征量計算部分計算至少目標(biāo)幀中的輸入語音信號的聲壓水平作為特征量,并且
其中,當(dāng)目標(biāo)幀的聲壓水平大于作為聲壓估計候選點(diǎn)的特征量的聲壓水平的最小值時,聲壓估計候選點(diǎn)更新部分丟棄具有最小值的聲壓估計候選點(diǎn)并且使目標(biāo)幀成為新的聲壓估計候選點(diǎn)。
3.根據(jù)權(quán)利要求2所述的語音處理裝置,
其中,特征量計算部分計算表示至少目標(biāo)幀中出現(xiàn)突發(fā)噪聲的可能性的突發(fā)噪聲信息作為特征量,并且
其中,當(dāng)基于突發(fā)噪聲信息目標(biāo)幀是包括突發(fā)噪聲的部分時,聲壓估計候選點(diǎn)更新部分不使目標(biāo)幀成為聲壓估計候選點(diǎn)。
4.根據(jù)權(quán)利要求2所述的語音處理裝置,
其中,當(dāng)相鄰聲壓估計候選點(diǎn)之間的幀間隔的最短幀間隔小于預(yù)定閾值時,聲壓估計候選點(diǎn)更新部分丟棄具有最短幀間隔的相鄰聲壓估計候選點(diǎn)中的具有小聲壓水平的聲壓估計候選點(diǎn),并且使目標(biāo)幀成為新的聲壓估計候選點(diǎn)。
5.根據(jù)權(quán)利要求4所述的語音處理裝置,
其中,以使預(yù)定閾值隨著時間的過去而增大的方式,確定預(yù)定閾值。
6.根據(jù)權(quán)利要求2所述的語音處理裝置,
其中,特征量計算部分計算至少從聲壓估計候選點(diǎn)直至目標(biāo)幀的過去的幀的數(shù)量作為特征量,并且
其中,當(dāng)聲壓估計候選點(diǎn)的過去的幀的數(shù)量的最大值大于預(yù)定的幀的數(shù)量時,聲壓估計候選點(diǎn)更新部分丟棄具有最大值的聲壓估計候選點(diǎn),并且使目標(biāo)幀成為新的聲壓估計候選點(diǎn)。
7.根據(jù)權(quán)利要求2所述的語音處理裝置,
其中,輸入語音信號被輸入到語音處理裝置,輸入語音信號是由放大部分進(jìn)行增益調(diào)節(jié)并且從模擬信號轉(zhuǎn)換成數(shù)字信號來得到的,并且
其中,基于計算得到的增益,增益計算部分計算增益應(yīng)用部分用于進(jìn)行增益調(diào)節(jié)的增益和放大部分用于進(jìn)行增益調(diào)節(jié)的增益。
8.根據(jù)權(quán)利要求1所述的語音處理裝置,
其中,聲壓估計部分通過以從最大聲壓水平開始的次序從聲壓估計候選點(diǎn)中排除給定比率數(shù)量的聲壓估計候選點(diǎn),執(zhí)行對聲壓的估計。
9.根據(jù)權(quán)利要求1所述的語音處理裝置,
其中,特征量計算部分計算表示至少目標(biāo)幀中出現(xiàn)突發(fā)噪聲的可能性的突發(fā)噪聲信息,并且
其中,基于聲壓估計候選點(diǎn)保持的突發(fā)噪聲信息和聲壓水平,聲壓估計部分執(zhí)行對聲壓的估計。
10.一種語音處理方法,包括:
從輸入語音信號的目標(biāo)幀中提取特征量;
使輸入語音信號的多個幀的每個成為聲壓估計候選點(diǎn),保持每個聲壓估計候選點(diǎn)的特征量,并且基于聲壓估計候選點(diǎn)的特征量和目標(biāo)幀的特征量,來更新聲壓估計候選點(diǎn);
基于聲壓估計候選點(diǎn)的特征量,計算輸入語音信號的估計聲壓;
基于估計聲壓,計算應(yīng)用于輸入語音信號的增益;以及
基于增益,執(zhí)行輸入語音信號的增益調(diào)節(jié)。
11.一種使計算機(jī)執(zhí)行以下處理的程序:
從輸入語音信號的目標(biāo)幀中提取特征量;
使輸入語音信號的多個幀的每個成為聲壓估計候選點(diǎn),保持每個聲壓估計候選點(diǎn)的特征量,并且基于聲壓估計候選點(diǎn)的特征量和目標(biāo)幀的特征量,來更新聲壓估計候選點(diǎn);
基于聲壓估計候選點(diǎn)的特征量,計算輸入語音信號的估計聲壓;
基于估計聲壓,計算應(yīng)用于輸入語音信號的增益;以及
基于增益,執(zhí)行輸入語音信號的增益調(diào)節(jié)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼公司,未經(jīng)索尼公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310018393.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





