[發(fā)明專利]拾音靈敏度的調(diào)整方法、裝置在審
| 申請?zhí)枺?/td> | 202010873943.0 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN112015364A | 公開(公告)日: | 2020-12-01 |
| 發(fā)明(設(shè)計)人: | 宋波 | 申請(專利權(quán))人: | 廣州視源電子科技股份有限公司;廣州視睿電子科技有限公司 |
| 主分類號: | G06F3/16 | 分類號: | G06F3/16;G06K9/00;G01S5/18 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 周春枚 |
| 地址: | 510530 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 靈敏度 調(diào)整 方法 裝置 | ||
本申請公開了一種拾音靈敏度的調(diào)整方法、裝置。其中,該方法包括:確定麥克風(fēng)陣列檢測到的聲源位置;依據(jù)聲源位置,調(diào)整圖像采集裝置的拍攝角度;在圖像采集裝置在拍攝角度采集到多張人臉圖像的情況下,識別多張人臉圖像中的多個嘴唇;依據(jù)多個嘴唇的權(quán)重從多個嘴唇中確定目標(biāo)嘴唇;確定目標(biāo)嘴唇與麥克風(fēng)陣列的相對方位;依據(jù)相對方位調(diào)整麥克風(fēng)陣列的拾音靈敏度。本申請解決了相關(guān)技術(shù)中依靠麥克風(fēng)陣列定位技術(shù)和人臉識別檢測造成的無法準(zhǔn)確定位真正講話人,并調(diào)整該講話人對應(yīng)的方位拾音靈敏度的技術(shù)問題。
技術(shù)領(lǐng)域
本申請涉及拾音領(lǐng)域,具體而言,涉及一種拾音靈敏度的調(diào)整方法、裝置。
背景技術(shù)
相關(guān)技術(shù)中一般采用聲音識別加上人臉檢測定位講話人的位置,例如,采用麥克風(fēng)陣列確定聲源位置,再結(jié)合圖像采集裝置采集人臉信息,并通過人臉識別技術(shù)捕捉講話的人,但是由于在多人場合存在多張人臉,因此,在依靠麥克風(fēng)陣列初步確定聲源的位置后,再依靠人臉檢測技術(shù)存在無法準(zhǔn)確捕捉講話的人,即無法準(zhǔn)確定位真正講話人,并調(diào)整該講話人對應(yīng)的方位拾音靈敏度的技術(shù)問題。
針對上述的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本申請實施例提供了一種拾音靈敏度的調(diào)整方法、裝置,以至少解決相關(guān)技術(shù)中依靠麥克風(fēng)陣列定位技術(shù)和人臉識別檢測造成的無法準(zhǔn)確定位真正講話人,并調(diào)整該講話人對應(yīng)的方位拾音靈敏度的技術(shù)問題。
根據(jù)本申請實施例的一個方面,提供了一種拾音靈敏度的調(diào)整方法,包括:確定麥克風(fēng)陣列檢測到的聲源位置;依據(jù)聲源位置,調(diào)整圖像采集裝置的拍攝角度;在圖像采集裝置在拍攝角度采集到多張人臉圖像的情況下,識別多張人臉圖像中的多個嘴唇;依據(jù)多個嘴唇的權(quán)重從多個嘴唇中確定目標(biāo)嘴唇;確定目標(biāo)嘴唇與麥克風(fēng)陣列的相對方位;依據(jù)相對方位調(diào)整麥克風(fēng)陣列的拾音靈敏度。
可選地,依據(jù)多個嘴唇的權(quán)重從多個嘴唇中確定目標(biāo)嘴唇之前,方法還包括:獲取預(yù)定時長內(nèi)多個嘴唇的動作頻率,其中,預(yù)定時長為采集多張人臉圖像的當(dāng)前時刻之前的預(yù)定時長;依據(jù)動作頻率確定多個嘴唇對應(yīng)的權(quán)重。
可選地,依據(jù)動作頻率確定多個嘴唇對應(yīng)的權(quán)重,包括:動作頻率越大,嘴唇對應(yīng)的權(quán)重越大。
可選地,獲取預(yù)定時間段內(nèi)多個嘴唇的動作頻率之前,方法還包括:確定當(dāng)前的會議場景類型;確定與會議場景類型對應(yīng)的時長,并將與會議場景類型對應(yīng)的時長作為預(yù)定時長。
可選地,麥克風(fēng)陣列與圖像采集裝置位于同一方位;確定目標(biāo)嘴唇與麥克風(fēng)陣列的相對方位,包括:獲取目標(biāo)嘴唇與圖像采集裝置的相對位置;根據(jù)相對位置確定目標(biāo)嘴唇與圖像采集裝置的相對方位;將目標(biāo)嘴唇與圖像采集裝置的相對方位作為目標(biāo)嘴唇與麥克風(fēng)陣列的相對方位。
可選地,調(diào)整麥克風(fēng)陣列在相對方位上的拾音靈敏度,包括:調(diào)整麥克風(fēng)陣列的拾音角度,以采集來自相對方位的聲音;根據(jù)麥克風(fēng)陣列的拾音效果調(diào)整拾音角度,拾音效果包括以下之一:音量增大或音量減??;根據(jù)拾音效果確定拾音靈敏度。
可選地,根據(jù)拾音效果調(diào)整拾音靈敏度,包括:根據(jù)拾音效果調(diào)整麥克風(fēng)陣列的增益值,以調(diào)整拾音靈敏度。
可選地,根據(jù)拾音效果調(diào)整麥克風(fēng)陣列的增益值,包括:若聲音減小,則將拾音角度按照前一次調(diào)整方向的相反方向進(jìn)行調(diào)整,直到聲音增大;當(dāng)聲音增大,則調(diào)整增益值,若增益值未達(dá)到目標(biāo)增益值,則按照前一次調(diào)整方向的相同方向進(jìn)行調(diào)整,直至增益值達(dá)到目標(biāo)增益。
可選地,依據(jù)多個嘴唇的權(quán)重從多個嘴唇中確定目標(biāo)嘴唇,包括:確定多個嘴唇的權(quán)重的最大權(quán)重;將最大權(quán)重對應(yīng)的嘴唇作為目標(biāo)嘴唇。
根據(jù)本申請實施例的一個方面,提供了一種拾音靈敏度的調(diào)整方法,包括:在圖像采集裝置采集到多張人臉圖像的情況下,識別多張人臉圖像中的多個嘴唇;確定多個嘴唇的優(yōu)先級;依據(jù)多個嘴唇的優(yōu)先級調(diào)整麥克風(fēng)陣列的拾音靈敏度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州視源電子科技股份有限公司;廣州視睿電子科技有限公司,未經(jīng)廣州視源電子科技股份有限公司;廣州視睿電子科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010873943.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 色相調(diào)整系統(tǒng)及其調(diào)整方法
- 調(diào)整設(shè)備和調(diào)整方法
- 踏板調(diào)整結(jié)構(gòu)及調(diào)整步態(tài)的調(diào)整方法
- 立體深度調(diào)整和焦點調(diào)整
- 調(diào)整裝置及其調(diào)整方法
- 噴嘴調(diào)整工具及調(diào)整方法
- 調(diào)整系統(tǒng)及調(diào)整方法
- 調(diào)整裝置以及調(diào)整方法
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 功率調(diào)整器(調(diào)整)





