[發明專利]顯示設備及音頻處理方法在審
| 申請號: | 202210102847.5 | 申請日: | 2022-01-27 |
| 公開(公告)號: | CN114615534A | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 王海盈;邢文峰 | 申請(專利權)人: | 海信視像科技股份有限公司 |
| 主分類號: | H04N21/43 | 分類號: | H04N21/43;H04N21/439;G10L21/0272;G10L25/30;G06V20/40;G06V40/20;G06V10/82;G06N3/02 |
| 代理公司: | 北京國之大銘知識產權代理事務所(普通合伙) 11565 | 代理人: | 張平 |
| 地址: | 266555 山東省青*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 顯示 設備 音頻 處理 方法 | ||
1.一種顯示設備,其特征在于,包括:控制器和多個音頻輸出接口;
所述控制器,被配置為:對獲取到的第一聲道音頻數據和第二聲道音頻數據分別進行人聲分離,得到第一聲道第一人聲音頻數據和第一聲道第一背景音頻數據,以及第二聲道第一人聲音頻數據和第二聲道第一背景音頻數據;
將所述第一聲道第一人聲音頻數據和所述第二聲道第一人聲音頻數據進行合并,得到目標人聲音頻數據;
獲取所述第一聲道音頻數據和第二聲道音頻數據所在時刻的圖像數據,對所述圖像數據進行唇動檢測,如果檢測到所述顯示設備屏幕中的唇動坐標,根據所述唇動坐標和單個所述多個音頻輸出接口的坐標,確定所述音頻輸出接口對應的人聲權重;
根據所述音頻輸出接口的坐標,確定所述音頻輸出接口對應第一聲道第一背景音頻數據和/或第二聲道第一背景音頻數據;
將所述目標人聲音頻數據和所述音頻輸出接口對應的人聲權重的乘積,以及所述音頻輸出接口對應的第一聲道第一背景音頻數據和/或第二聲道第一背景音頻數據合并,并進行音效增強處理,得到所述音頻輸出接口對應的音頻數據;
單個音頻輸出接口,被配置為:輸出所述音頻輸出接口對應的音頻數據。
2.根據權利要求1所述的顯示設備,其特征在于,所述控制器還被配置為:按照第一增益分別對所述第一聲道第一人聲音頻數據和所述第二聲道第一人聲音頻數據進行增益處理,得到第一聲道第二人聲音頻數據和第二聲道第二人聲音頻數據;
按照第二增益分別對所述第一聲道第一背景音頻數據和所述第二聲道第一背景音頻數據進行增益處理,得到第一聲道第二背景音頻數據和第二聲道第二背景音頻數據;其中,所述第一增益和所述第二增益根據所述顯示設備對應的聲音控制模式確定;
所述控制器,被配置為:
將所述第一聲道第二人聲音頻數據和所述第二聲道第二人聲音頻數據進行合并,得到目標人聲音頻數據;以及
針對每個音頻輸出接口,根據所述音頻輸出接口的坐標,確定所述音頻輸出接口對應第一聲道第二背景音頻數據和/或第二聲道第二背景音頻數據;
將所述目標人聲音頻數據和所述音頻輸出接口對應的人聲權重的乘積,以及所述音頻輸出接口對應的第一聲道第二背景音頻數據和/或第二聲道第二背景音頻數據合并,并進行音效增強處理,得到所述音頻輸出接口對應的音頻數據。
3.根據權利要求1所述的顯示設備,其特征在于,所述控制器,還被配置為:如果未檢測到唇動坐標,針對每個音頻輸出接口,根據所述第一聲道第一人聲音頻數據的能量和所述第二聲道第一人聲音頻數據的能量的比值,以及所述音頻輸出接口的坐標,確定所述音頻輸出接口分別對應的人聲權重。
4.根據權利要求1所述的顯示設備,其特征在于,所述屏幕包括:左區域、中間區域和右區域;所述控制器,被配置為:
如果所述音頻輸出接口的坐標對應于左區域,確定所述音頻輸出接口對應第一聲道第一背景音頻數據;
如果所述音頻輸出接口的坐標對應于右區域,確定所述音頻輸出接口對應第二聲道第一背景音頻數據;
如果所述音頻輸出接口的坐標對應于中間區域,確定所述音頻輸出接口對應第一聲道第一背景音頻數據和第二聲道第一背景音頻數據。
5.根據權利要求1所述的顯示設備,其特征在于,所述屏幕包括:中間區域和非中間區域;所述控制器,被配置為:
如果所述唇動坐標位于所述非中間區域,根據所述唇動坐標和所述多個音頻輸出接口的坐標,確定所述多個音頻輸出接口分別對應的人聲權重;
如果所述唇動坐標位于所述中間區域,根據所述多個音頻輸出接口的坐標和所述多個音頻輸出接口的屬性信息,確定所述多個音頻輸出接口分別對應的人聲權重,其中,所述屬性信息包括音量大小和/或朝向。
6.根據權利要求1所述的顯示設備,其特征在于,所述控制器,被配置為:針對每個音頻輸出接口,根據所述音頻輸出接口的坐標,確定所述音頻輸出接口在所述屏幕中對應的區域;
如果所述唇動坐標位于所述音頻輸出接口對應的區域內,確定所述音頻輸出接口對應的人聲權重為第一數值;
如果所述唇動坐標位于所述音頻輸出接口對應的區域外,確定所述音頻輸出接口對應的人聲權重為第二數值,所述第二數值小于所述第一數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于海信視像科技股份有限公司,未經海信視像科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210102847.5/1.html,轉載請聲明來源鉆瓜專利網。





