[發(fā)明專利]信號處理裝置和方法有效
| 申請?zhí)枺?/td> | 201310492196.6 | 申請日: | 2013-10-18 |
| 公開(公告)號: | CN103794221B | 公開(公告)日: | 2017-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 大迫慶一;安部素嗣 | 申請(專利權(quán))人: | 索尼公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L25/03 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 杜誠,王娜麗 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 信號 處理 裝置 方法 以及 程序 | ||
相關(guān)申請的交叉引用
本申請要求在2012年10月26日提交的日本優(yōu)先權(quán)專利申請JP2012-236313的權(quán)益,該日本優(yōu)先權(quán)專利申請的全部內(nèi)容通過引用結(jié)合于此。
技術(shù)領(lǐng)域
本技術(shù)涉及信號處理裝置和方法以及程序,并且具體地涉及使得能夠以高準(zhǔn)確度去除在記錄語音時(shí)出現(xiàn)的噪聲的信號處理裝置和方法以及程序。
背景技術(shù)
在用于記錄語音(包括運(yùn)動圖像)的設(shè)備之中,已知視頻攝像機(jī)、具有拍攝運(yùn)動圖像功能的數(shù)碼相機(jī)、智能電話和數(shù)碼錄音筆等。在操作這些設(shè)備時(shí),從設(shè)備主體中出現(xiàn)的聲音有時(shí)污染所記錄的語音。
在拍攝運(yùn)動圖像時(shí)出現(xiàn)例如變焦驅(qū)動聲音、自動對焦驅(qū)動聲音和孔徑光闌驅(qū)動聲音等。這些聲音由于對設(shè)備內(nèi)部的部件的驅(qū)動而出現(xiàn),并且根據(jù)驅(qū)動方式和控制方式而具有各種聲學(xué)特性。
此外,近年來,壓電元件響應(yīng)于所施加的電壓的變形通常用于根據(jù)自動對焦和變焦來驅(qū)動鏡頭。由于壓電元件而產(chǎn)生的驅(qū)動聲音有時(shí)與現(xiàn)有的那些具有不同的特性。
這種驅(qū)動聲音所引起的噪聲有時(shí)稱為突發(fā)性噪聲。污染所記錄的語音的突發(fā)性噪聲對于耳朵極其刺耳,因而期望用于降低該聲音的措施或去除噪聲的措施等。
已經(jīng)提出了一些針對突發(fā)性噪聲的措施。
例如,提出了一種技術(shù),該技術(shù)用于響應(yīng)于已經(jīng)被發(fā)送的驅(qū)動信號,根據(jù)驅(qū)動信號被發(fā)送的時(shí)刻之前的時(shí)間段的語音信號來生成合成的語音信號,并且將合成的語音信號與驅(qū)動信號被發(fā)送的時(shí)刻之后的時(shí)間段中的語音信號合成(例如,日本專利特開No.2011-002723,在下文中將其稱為專利文獻(xiàn)1)。
此外,還提出了一種技術(shù),該技術(shù)用于根據(jù)驅(qū)動命令從在某個時(shí)間段內(nèi)來自麥克風(fēng)的輸出語音中提取光學(xué)元件的驅(qū)動的頻率分量特性,檢測具有某個水平以上的區(qū)間,并且基于在該區(qū)間之前和之后的語音來執(zhí)行預(yù)測和插值(例如,日本專利特開No.2012-114842,在下文中將其稱為專利文獻(xiàn)2)。從而,能夠以高準(zhǔn)確度來去除伴隨著成像光學(xué)系統(tǒng)的驅(qū)動的驅(qū)動噪聲。
發(fā)明內(nèi)容
然而,專利文獻(xiàn)1的技術(shù)不考慮從驅(qū)動信號的發(fā)送到設(shè)備操作的延遲以及聲音從驅(qū)動聲音源到達(dá)麥克風(fēng)的時(shí)間等。由于這個原因,即使在沒有驅(qū)動噪聲的區(qū)間中也執(zhí)行噪聲降低處理,這有時(shí)導(dǎo)致原始聲音的保真度的劣化。
此外,專利文獻(xiàn)2的技術(shù)旨在在關(guān)注主要不小于10kHz的高頻帶中的功率的情況下確定噪聲去除區(qū)間。然而,在實(shí)際的圖像拍攝環(huán)境中,在10kHz頻帶內(nèi),除了驅(qū)動聲音之外的各種類型的聲音不計(jì)其數(shù),這可能導(dǎo)致錯誤確定。
此外,近年來在諸如智能電話的電子設(shè)備中內(nèi)置的、節(jié)能并且低高度的相機(jī)功能單元中,壓電元件用于根據(jù)自動對焦和變焦來驅(qū)動鏡頭。
雖然由于這樣的壓電元件而產(chǎn)生的驅(qū)動聲音所引起的噪聲是突發(fā)性噪聲,但在驅(qū)動時(shí)該噪聲通常能夠接連發(fā)生數(shù)次。當(dāng)這樣接連發(fā)生的突發(fā)性噪聲中的一部分未被去除時(shí),有時(shí)更給人不舒服的感覺。
期望能夠以高準(zhǔn)確度來去除在記錄語音時(shí)出現(xiàn)的噪聲。
根據(jù)本技術(shù)的實(shí)施例,提供了一種信號處理裝置,包括:特征量提取單元,配置成從對語音信號進(jìn)行頻率轉(zhuǎn)換而獲得的頻域信號中提取頻域信號的特征量;以及確定單元,配置成基于所提取的特征量來確定預(yù)定區(qū)間內(nèi)語音信號中是否存在噪聲,其中,特征量是由多個元素組成的,并且其中,多個元素包括基于以下兩者之間的相關(guān)值所定義的元素:作為與預(yù)定區(qū)間內(nèi)語音信號的頻域信號相關(guān)的波形的特征量波形,以及在時(shí)間上與預(yù)定區(qū)間相繼的另一區(qū)間內(nèi)的特征量波形。
特征量的多個元素中的每一個元素均可基于預(yù)定區(qū)間內(nèi)的特征量波形而計(jì)算。
預(yù)定區(qū)間內(nèi)的特征量波形可以是通過從頻域信號中提取預(yù)設(shè)頻帶的信號強(qiáng)度而獲得的一維信號的波形。
特征量的多個元素還可以包括特征量波形的幅度的最大值、或表示特征量波形的突發(fā)性的值。
信號處理裝置還可以包括從頻率轉(zhuǎn)換之前的語音信號中提取特征量的另一特征量提取單元。
確定單元可以將基于電子控制而驅(qū)動的部件的驅(qū)動聲音確定為噪聲,該信號處理裝置還可以包括控制信號提供單元,控制信號提供單元配置成將表示是否存在部件的驅(qū)動的控制信號提供給特征量提取單元。
信號處理裝置還可以包括因數(shù)保持單元,因數(shù)保持單元配置成保持用于確定單元進(jìn)行的確定、并且預(yù)先通過學(xué)習(xí)來獲得的因數(shù)。
確定單元可以將基于電子控制而驅(qū)動的部件的驅(qū)動聲音確定為噪聲,該信號處理裝置還包括:驅(qū)動信息提供單元,配置成將表示部件的驅(qū)動方式的信息提供給因數(shù)保持單元,并且該因數(shù)保持單元基于從驅(qū)動信息提供單元提供的信息來將因數(shù)提供給確定單元。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于索尼公司,未經(jīng)索尼公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310492196.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 亮度信號/色信號分離裝置和亮度信號/色信號分離方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 雙耳信號的信號生成
- 雙耳信號的信號生成
- 信號處理裝置、信號處理方法、信號處理程序
- USBTYPEC信號轉(zhuǎn)HDMI信號的信號轉(zhuǎn)換線
- 信號盒(信號轉(zhuǎn)換)
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置





