[發(fā)明專利]基于聲紋識別的視頻參數(shù)調(diào)整方法、裝置及讀存儲介質(zhì)有效

申請?zhí)枺?/td>	201811586465.4	申請日：	2018-12-21
公開（公告）號：	CN109448735B	公開（公告）日：	2022-05-20
發(fā)明（設(shè)計）人：	付華東	申請（專利權(quán)）人：	深圳創(chuàng)維-RGB電子有限公司
主分類號：	G10L17/22	分類號：	G10L17/22;G10L17/08;G10L25/63;H04N21/485
代理公司：	深圳市世紀恒程知識產(chǎn)權(quán)代理事務(wù)所 44287	代理人：	胡海國
地址：	518057 廣東省深圳市***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于聲紋識別視頻參數(shù) 調(diào)整方法裝置存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于聲紋識別的視頻參數(shù)調(diào)整方法，其特征在于，所述基于聲紋識別的視頻參數(shù)調(diào)整方法包括以下步驟：

在智能終端播放視頻節(jié)目時，接收聲紋數(shù)據(jù)采集模塊采集的音頻信息；

在聲紋特征庫中存在所述音頻信息對應(yīng)的目標預(yù)設(shè)音頻信息時，基于所述目標預(yù)設(shè)音頻信息，確定所述音頻信息對應(yīng)的用戶身份信息以及用戶心情信息；

獲取所述用戶心情信息對應(yīng)的參數(shù)調(diào)整模式的調(diào)整參數(shù)，以及基于所述用戶身份信息獲取所述參數(shù)調(diào)整模式對應(yīng)的調(diào)整比例；

基于所述調(diào)整參數(shù)以及調(diào)整比例調(diào)整所述智能終端的視頻播放參數(shù)；

其中，所述在聲紋特征庫中存在所述音頻信息對應(yīng)的目標預(yù)設(shè)音頻信息時，基于所述目標預(yù)設(shè)音頻信息，確定所述音頻信息對應(yīng)的用戶身份信息以及用戶心情信息的步驟包括：

確定所述音頻信息對應(yīng)的聲紋特征向量；

確定聲紋特征庫的預(yù)設(shè)音頻信息對應(yīng)的預(yù)設(shè)特征向量中，是否存在與所述聲紋特征向量匹配的目標特征向量；

若存在，則基于目標特征向量對應(yīng)的目標預(yù)設(shè)音頻信息，確定所述音頻信息對應(yīng)的用戶身份信息以及用戶心情信息；

所述聲紋特征向量包括音調(diào)特征向量、響度特征向量和音色特征向量，所述確定聲紋特征庫的預(yù)設(shè)音頻信息對應(yīng)的預(yù)設(shè)特征向量中，是否存在與所述聲紋特征向量匹配的目標特征向量的步驟包括：

計算各個所述預(yù)設(shè)特征向量中的預(yù)設(shè)音色特征向量，與所述音色特征向量之間的第二相似度；

在所述第二相似度中的最大相似度大于第二預(yù)設(shè)相似度時，基于所述最大相似度獲取參數(shù)調(diào)整模式對應(yīng)的預(yù)設(shè)音調(diào)特征向量以及預(yù)設(shè)響度特征向量，并基于所述響度特征向量、音色特征向量、預(yù)設(shè)音調(diào)特征向量以及預(yù)設(shè)響度特征向量，確定預(yù)設(shè)特征向量中，是否存在與所述聲紋特征向量匹配的目標特征向量。

2.如權(quán)利要求1所述的基于聲紋識別的視頻參數(shù)調(diào)整方法，其特征在于，所述確定聲紋特征庫的預(yù)設(shè)音頻信息對應(yīng)的預(yù)設(shè)特征向量中，是否存在與所述聲紋特征向量匹配的目標特征向量的步驟包括：

計算所述聲紋特征庫中各個預(yù)設(shè)音頻信息對應(yīng)的預(yù)設(shè)特征向量，與所述聲紋特征向量之間的第一相似度；

確定所述第一相似度中的最大相似度是否大于第一預(yù)設(shè)相似度，其中，在所述第一相似度中的最大相似度大于第一預(yù)設(shè)相似度時，確定聲紋特征庫中存在與所述聲紋特征向量匹配的目標特征向量，所述第一相似度中的最大相似度所對應(yīng)的預(yù)設(shè)聲紋特征向量為所述目標特征向量。

3.如權(quán)利要求1所述的基于聲紋識別的視頻參數(shù)調(diào)整方法，其特征在于，所述確定所述音頻信息對應(yīng)的聲紋特征向量的步驟包括：

基于預(yù)設(shè)時間窗，按照預(yù)設(shè)頻率對所述音頻信息進行采樣，以獲得采樣數(shù)據(jù)；

根據(jù)所述采樣數(shù)據(jù)生成所述聲紋特征向量。

4.如權(quán)利要求1所述的基于聲紋識別的視頻參數(shù)調(diào)整方法，其特征在于，所述在所述第二相似度中的最大相似度大于第二預(yù)設(shè)相似度時，基于所述最大相似度獲取參數(shù)調(diào)整模式對應(yīng)的預(yù)設(shè)音調(diào)特征向量以及預(yù)設(shè)響度特征向量，并基于所述響度特征向量、音色特征向量、預(yù)設(shè)音調(diào)特征向量以及預(yù)設(shè)響度特征向量，確定預(yù)設(shè)特征向量中，是否存在與所述聲紋特征向量匹配的目標特征向量的步驟包括：

在所述第二相似度中的最大相似度大于第二預(yù)設(shè)相似度時，確定所述第二相似度中的最大相似度的預(yù)設(shè)音色特征向量所對應(yīng)的用戶身份信息，并基于所述用戶身份信息獲取參數(shù)調(diào)整模式對應(yīng)的預(yù)設(shè)音調(diào)特征向量以及預(yù)設(shè)響度特征向量，其中，所述參數(shù)調(diào)整模式包括增強模式、中間模式以及減弱模式；

計算所述音調(diào)特征向量與所述預(yù)設(shè)音調(diào)特征向量之間的第三相似度，以及計算所述響度特征向量與所述預(yù)設(shè)響度特征向量之間的第四相似度；

基于所述第三相似度以及所述第四相似度，確定預(yù)設(shè)特征向量中，是否存在與所述聲紋特征向量匹配的目標特征向量。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳創(chuàng)維-RGB電子有限公司，未經(jīng)深圳創(chuàng)維-RGB電子有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811586465.4/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。