[發(fā)明專利]聲音處理設(shè)備和聲音處理方法在審
| 申請?zhí)枺?/td> | 202010074485.4 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111489750A | 公開(公告)日: | 2020-08-04 |
| 發(fā)明(設(shè)計)人: | 宮本正成;大橋宏正;田中直也 | 申請(專利權(quán))人: | 松下知識產(chǎn)權(quán)經(jīng)營株式會社 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/20;G10L21/0232;G10L21/0264 |
| 代理公司: | 北京林達劉知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲音 處理 設(shè)備 方法 | ||
本發(fā)明涉及一種聲音處理設(shè)備和聲音處理方法。目的是抑制由麥克風(fēng)收集的說話者所發(fā)出的音質(zhì)的劣化。聲音處理設(shè)備包括:n個麥克風(fēng),其與n個人相對應(yīng)地布置,并且主要收集各個相關(guān)人所發(fā)出的聲音信號;濾波器,其使用n個麥克風(fēng)所收集的聲音信號,來抑制由與至少一個說話者相對應(yīng)的麥克風(fēng)收集的說話者聲音信號中所包括的串音成分;參數(shù)更新器,其在滿足包括至少一個說話者說話的時間的預(yù)定條件的情況下,更新用于抑制串音成分的濾波器的參數(shù),并且將更新結(jié)果存儲在存儲器中;以及聲音輸出控制器,其從揚聲器輸出通過利用濾波器基于更新結(jié)果、從說話者聲音信號中減去串音成分而獲取到的聲音信號。
技術(shù)領(lǐng)域
本發(fā)明涉及聲音處理設(shè)備和聲音處理方法。
背景技術(shù)
例如,在車體的縱向方向上布置有多個(例如,兩列或更多列)座椅的諸如廂式旅行車、貨車或單廂車等的相對大的車輛中,考慮安裝如下的聲音技術(shù),該聲音技術(shù)用于在坐在駕駛座的駕駛員和坐在后排座的乘員(例如,駕駛員的家庭乘員或朋友)之間進行會話,播放能到達該后排座椅的汽車音頻的音樂,或者使用各個座椅中所安裝的麥克風(fēng)和揚聲器來在乘員或車載設(shè)備之間傳遞或輸入/輸出聲音。
另外,近年來,發(fā)布了包括通信接口的大量車輛。通信接口具有無線通信功能,并且例如由移動電話網(wǎng)絡(luò)(蜂窩網(wǎng)絡(luò))或無線局域網(wǎng)(LAN)等構(gòu)建,因而還在車輛中建立了網(wǎng)絡(luò)環(huán)境。駕駛員等例如經(jīng)由通信接口訪問因特網(wǎng)線路上的云計算系統(tǒng)(以下簡稱為“云”),因而可以在駕駛時接收各種服務(wù)。
這里,作為在家用電器中使用云的聲音技術(shù)其中之一,加速了自動聲音識別系統(tǒng)的開發(fā)。自動聲音識別系統(tǒng)作為用于接收云上的服務(wù)的人機接口而普及。自動聲音識別系統(tǒng)將人類所發(fā)出的聲音轉(zhuǎn)換成文本數(shù)據(jù)等,并且使諸如計算機等的控制設(shè)備識別這些聲音的內(nèi)容。自動聲音識別系統(tǒng)是取代使用人類手指的鍵盤輸入的接口,并且能夠通過更接近人類的操作來指示計算機等。具體地,在車輛中,在根據(jù)現(xiàn)有技術(shù)的基于駕駛員的駕駛中或者例如在以自動駕駛級別3的自動駕駛中,采用駕駛員的手指來操縱方向盤,因而存在引入針對車輛的自動聲音識別所用的聲音技術(shù)的必然動機。
根據(jù)國家公路交通安全管理局(NHTSA),自動駕駛級別被分類為無駕駛自動化(級別0)、駕駛員輔助(級別1)、部分駕駛自動化(級別2)、有條件駕駛自動化(級別3)、高駕駛自動化(級別4)和完全駕駛自動化(級別5)。在級別3,自動駕駛系統(tǒng)主導(dǎo)駕駛,并且如有必要,則請求人類的駕駛。近年來,自動駕駛系統(tǒng)的級別3已投入實際使用。
作為根據(jù)現(xiàn)有技術(shù)的自動聲音識別所用的聲音技術(shù),已知有如下的技術(shù)(例如,參考日本特開2017-76117,專利文獻1),該技術(shù)用于判斷所發(fā)出的音頻數(shù)據(jù)(聲音信號)是否與熱詞相對應(yīng),產(chǎn)生被判斷為與該熱詞該相對應(yīng)的音頻數(shù)據(jù)的熱詞音頻指紋,并且在該熱詞音頻指紋與先前存儲的熱詞音頻指紋一致的情況下,取消向發(fā)聲的計算機裝置的訪問。
專利文獻1:日本特開2017-76117
發(fā)明內(nèi)容
然而,在日本特開2017-76117的結(jié)構(gòu)中,在布置了不同的麥克風(fēng)以與車體中的各個座椅相對應(yīng)的情況下,存在如下的可能性:周圍的其他乘員所發(fā)出的語音也被作為聲音而收集到供說話者用的麥克風(fēng),其中該麥克風(fēng)布置在與各個說話者的嘴分開大致規(guī)定距離的位置。其他乘員所發(fā)出的語音是所謂的串音成分,并且是極有可能使供說話者用的麥克風(fēng)最初所收集的聲音的音質(zhì)劣化的額外聲音信號。因此,供說話者用的各麥克風(fēng)所收集的聲音的音質(zhì)由于串音成分而劣化,因而存在對說話者所發(fā)出的聲音的識別性能劣化的問題。
本發(fā)明是考慮到上述的根據(jù)現(xiàn)有技術(shù)的情形而提出的,并且本發(fā)明的非限制性目的是提供如下的一種聲音處理設(shè)備和聲音處理方法,該聲音處理設(shè)備和聲音處理方法在與各個人相對應(yīng)地布置了不同的麥克風(fēng)的環(huán)境下,減輕基于周圍的其他人所發(fā)出的聲音的串音成分的影響,并且抑制由說話者發(fā)出且由相關(guān)麥克風(fēng)收集的聲音的音質(zhì)的劣化。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于松下知識產(chǎn)權(quán)經(jīng)營株式會社,未經(jīng)松下知識產(chǎn)權(quán)經(jīng)營株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010074485.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





